Báo chí điều tra, Báo chí dữ liệu, Nghiệp vụ báo chí|

Báo chí dữ liệu không dừng lại ở việc minh hoạ bài viết bằng những biểu đồ hay infographic đẹp đẽ. Hội nghị báo chí điều tra châu Á 2018 với hơn nửa số buổi tập huấn tập trung vào báo chí dữ liệu nhấn mạnh một kinh nghiệm vô cùng quan trọng: chủ động tìm kiếm, lưu trữ, phân tích và kiểm chứng dữ liệu có thể giúp nhà báo nảy ra tìm ra những ý tưởng, những đầu mối thiết yếu cho bài viết của mình.

Trong ngày thứ 2 của hội nghị, ông Yoichiro Tateiwa, giám đốc Trung Tâm Tiền tệ và Chính Trị của Nhật Bản đã kể một câu chuyện rất đáng lưu tâm. Vào ngày 12 tháng 3 năm 2011, chỉ một ngày sau khi lò hạt nhân Fukushima Daiichi bị sóng thần phá huỷ, Yoichiro, có trong tay dữ liệu của chính phủ Mỹ, nhận thấy nồng độ bức xạ ion hoá quanh thủ đô Tokyo cao gấp 10 lần mức cho phép. Chính phủ Mỹ lúc đó đã đưa ra cảnh báo khẩn cấp yêu cầu công dân nước này nhanh chóng rời Tokyo, mặc dù chính phủ Nhật lại cho rằng đây là sự phản ứng thái quá. Theo Yoichiro, chính phủ Nhật Bản đã kiên quyết không chịu nhìn thẳng vào sự thật, mặc dù sức khoẻ của toàn bộ người dân Tokyo đang bị đe doạ.

“Dữ liệu có thể nói cho bạn rất nhiều thứ tuyệt vời,” Yoichiro kết luận. Trong trường hợp của Yoichiro, những con số ông có được công khai trên website của Đại sứ quán Mỹ tại Nhật Bản. Khi dữ liệu không có sẵn, phóng viên sẽ phải kiên nhẫn tìm kiếm. Điều tuyệt vời là tài nguyên dữ liệu trải rộng từ thông tin website, bảng kê, bản đồ, ảnh vệ tinh đến mạng xã hội – bất cứ nguồn nào cũng có thể là khởi đầu cho một câu chuyện.

Với cách tiếp cận đúng đắn, phóng viên có thể đi rất xa trong cuộc hành trình tìm kiếm dữ liệu. MDI xin tổng hợp  một vài phương thức khai thác dữ liệu được giới thiệu tại hội nghị.

1/Khai thác tài nguyên web

Theo bà Giannina Segnini, giảng viên trường báo chí Đại học Columbia (Mỹ), chỉ 4% lượng thông tin trên mạng được hệ thống hoá và có thể được tìm thấy bởi các công cụ tìm kiếm cơ bản như Google hay Bing. 96% lượng thông tin còn lại thuộc về thế giới Deep Web và Dark Web, nơi lưu giữ các thông tin tối mật và cũng ẩn chứa vô vàn thông tin phi pháp.

Ảnh: Wikipedia

Tuy nhiên, bà Giannina cũng khẳng định rằng chỉ cần khai thác được tối đa 4% dữ liệu này, nhà báo đã có thể nắm trong tay một lượng thông tin lớn rất hữu ích. Các cách thức tìm kiếm thông thường không cho phép nhà báo tìm được kết quả tối ưu, vì vậy bà Giannina gợi ý dùng một số lệnh đặc biệt trên Google để quá trình tìm kiếm được cụ thể hoá. Ví dụ lệnh site: đi kèm với tên miền để tìm thông tin chỉ trong một loại tên miền (site:data.gov; site:edu, v.v…); hay lệnh filetype:xls để đưa thẳng chúng ta đến các bảng dữ liệu. Các nhà báo có thể tham khảo một số lệnh cơ bản khác tại đây.

Ngoài Google, bà Giannina cũng giới thiệu một số hệ thống dữ liệu đặc thù giúp tiết kiệm thời gian tra cứu hơn. Enigma.io, được bà Giannina gọi là ‘Google của các loại dữ liệu’, cung cấp nhiều dữ liệu thô của chính phủ một số nước cũng như các tổ chức phi chính phủ như Liên Hợp Quốc, Quỹ Tiền tệ Quốc tế. OpenCorporates chứa thông tin của hàng triệu công ty trên khắp thế giới trong đó có Việt Nam, Wipo.int có một hệ thống tất cả nhãn hàng từng được đăng ký, hay Global Open Data Index cho phép so sánh dữ liệu giữa các nước trong rất nhiều lĩnh vực. Ngoài ra còn có rất nhiều công cụ tra cứu báo cáo tài khoá, hồ sơ toà án, thống kê hải quan, phóng viên có thể tham khảo tại đây.

2/Mạng xã hội

Phóng viên Paul Meyers của BBC trong buổi tập huấn về sử dụng công cụ tìm kiếm online. Ảnh: MDI

Công cụ tìm kiếm thông thường của các mạng xã hội Facebook, Twitter hay LinkedIn không cho ta biết được hết tất cả các thông tin được đăng trên đó, theo phóng viên Paul Meyers của đài BBC. Rất may, Paul có một thực đơn khá phong phú các công cụ giúp phóng viên nhìn được tất tần tật các thông tin của mạng xã hội (ngoại trừ những nội dung người dùng để bí mật). Ví dụ, Stalkscan và PeopleFindThor.dk cho Facebook; Tweet Beaver Followerwonk dành cho Twitter. Những công cụ này đã được Paul hệ thống lại một cách rất chi tiết tại link sau.

Khi dữ liệu trên mạng xã hội quá khổng lồ và không thể hiện rõ một xu hướng hay đặc thù cụ thể, công việc tiếp theo của phóng viên sẽ là thu gom và phân tích lượng dữ liệu này để tìm ra câu chuyện. Các phóng viên dữ liệu của đài KBS (Hàn Quốc) có một ý tưởng vô cùng sáng tạo: lập trình riêng một ứng dụng phân tích dữ liệu. Đội ngũ báo chí dữ liệu của đài KBS, bao gồm cả lập trình viên, phóng viên, nhân viên thiết kế, phân tích thông tin, đã tạo một tài khoản lập trình viên trên Twitter, tạo ứng dụng ngay trên nền tảng này và chạy các lệnh cần thiết để để tìm ra những chủ đề, từ khoá, những tính từ được tổng thống Mỹ Donald J. Trump sử dụng nhiều nhất. Chỉ trong 6 tháng đầu năm 2018, tổng thống Trump nhắc lại từ ‘nhân dân’, ‘tổng thống’ và chính tên mình, ‘Trump’ nhiều nhất. Danh từ được dùng nhiều nhất là ‘Triều Tiên’, tính từ được nhắc lại nhiều nhất là ‘lớn’ và chủ đề được vị tổng thống quan tâm nhất là ‘vụ lùm xùm giữa Trump – Nga’.

3/ Ảnh vệ tinh

Ảnh vệ tinh là công cụ đắc lực khi phóng viên phải tường thuật về những nơi khó có thể đặt chân đến như vùng chiến sự, vùng thiên tai, bạo loạn. Tuy nhiên công dụng của ảnh vệ tinh không chỉ dừng lại ở đó. Theo kinh nghiệm của nhiều nhà báo tham dự hội nghị, nhiều câu chuyện không xuất hiện cho đến khi ta nhìn xuống từ trên cao.

“Bạn có một câu chuyện, nhưng bạn cần xác minh câu chuyện này, tìm được các bằng chứng và kết nối chúng lại, khớp các manh mối còn dở dang,” bà Anusuya Datta, biên tập viên của Geospatial nói tại một buổi tập huấn. Theo Datta, đây chính là những lúc ảnh vệ tinh là có thể là cứu tinh. Không thể không nhắc đến ví dụ kinh điển liên quan của đài BBC Africa Eye (tạm dịch: Đôi mắt Châu Phi). Tháng 7 năm ngoái, mạng xã hội truyền tay nhau một đoạn clip có 2 trẻ em và 2 phụ nữ bị một toán lính người châu Phi dẫn đi, bịt mặt và bắn vào người 22 lần. Chỉ với đoạn clip với độ phân giải thấp đó, các phóng viên của đài BBC đã sử dụng hình ảnh vệ tinh để tìm chính xác vị trí ngọn núi, con đường, cây cối và nhà cửa ven đường, từ đó tìm ra vị trí nhóm người này bị hành quyết. Chính phủ Cameroon, mặc dù ban đầu phủ nhận đây là tin giả, sau đó đã phải mở một cuộc điều tra và bắt giữ nhóm lính phạm tội này.

Theo bà Datta, camera vệ tinh đã từng giúp hãng AP lần ra được dấu vết một đường dây buôn người trên hải giới của Indonesia và Papua New Guinea, sau hàng tháng trời truy đuổi bằng nhiều cách khác nhau. Ảnh vệ tinh chụp được bởi Geospatial cho thấy chính xác khoảnh khắc tàu con đang vận chuyển người lên tàu lớn. Ảnh vệ tinh cũng đã từng tố cáo Iran đang bí mật phát triển hạt nhân vào năm 2015, cho thấy rừng rậm Amazon đang nhỏ lại nhanh cỡ nào, hay giúp hãng tin Reuters tường thuật về vụ việc thanh lọc sắc tộc tại Myanmar với người Hồi giáo Rohingya.

Trong một ví dụ gần gũi hơn, bà Christine Chan, biên tập viên đồ hoạ của hãng tin Reuters cho biết, ảnh vệ tinh là một phần không thể thiếu khi hãng tường thuật về vấn đề biển Đông. Với ảnh vệ tinh, độc giả có thể nhìn thấy chính xác sự thay đổi địa lý của từng hòn đảo trên vùng biển không bình lặng này trong những năm vừa qua.

Quần đảo Trường Sa tháng 12/2015 và tháng 5/2016. Ảnh: DigitalGlobe

Theo bà Datta của Geospatial, để sử dụng hình vệ tinh miễn phí, các phóng viên có thể tham khảo hình ảnh vệ tinh của Landsat (NASA), ESA, Bhuvan, Google Earth. Ngoài ra, một số dịch vụ cần trả phí có gói đặc biệt dành cho nhà báo như Planet, DigitalGlobe hay Airhub.

4/Bản đồ

Giống như ảnh vệ tinh, nhiều câu chuyện cũng không xuất hiện cho đến khi ta nhìn vào bản đồ. Andrew Lehren, phóng viên nhóm điều tra của đài NBC giải thích rằng sử dụng bản đồ không dừng lại ở việc thu thập các bản đồ có sẵn, mà phần lớn dựa vào việc kết hợp nhiều dữ liệu để cho ra một bản đồ có nghĩa.

Trong buổi tập huấn dài hơn một tiếng, bằng cách kết hợp dữ liệu các nạn nhân bị đạn lạc của cảnh sát New York với biểu đồ nhân khẩu của thành phố, Lehren chỉ ra rằng đa số các vụ tai nạn xảy ra đối với nạn nhân da màu ở các khu vực tập trung đông dân da đen. Đây là một ví dụ nhỏ minh hoạ cho việc bản đồ có thể kể một câu chuyện như thế nào dựa trên bài báo Giữa làn đạn của phóng viên Erin Horan. Theo ông Lehren, tờ The New York Times (Mỹ) sử dụng vô cùng triệt để những bản đồ dạng này để kể chuyện. Toà soạn này đã từng tạo một series các bản đồ tương tác cho cuộc bầu cử tổng thống 2016, một bản đồ chi tiết về công cuộc tìm kiếm máy bay mất tích MH370 của hãng hàng không Malaysia, bản đồ về tốc độ xây dựng nhà cửa tại Mỹ, và rất nhiều bản đồ tương tự.

Bản đồ minh hoạ cho bài báo Giữa làn đạn của Erin Horan. Ảnh: Andrew Lehren

Với người mới bắt đầu, ông Lehren giới thiệu ArcGIS, một website cho phép tạo bản đồ miễn phí với một kho dữ liệu bản đồ có sẵn. Hướng dẫn từng bước sử dụng ArcGIS có thể tìm thấy ở đây.

Trang Bùi

Trung tâm Sáng kiến Truyền thông và Phát triển (MDI) là thành viên duy nhất tại Việt Nam của Mạng lưới Báo chí Điều tra Toàn cầu GIJN. Các phóng viên, toà soạn có nhu cầu tìm hiểu thêm tài nguyên báo chí dữ liệu có thể liên lạc với MDI để được hỗ trợ.

Hội nghị Báo chí Điều tra Thế giới 2019 sẽ được tổ chức từ ngày 26-29 tháng 9 ở thành phố Hamburg, Đức. Các phóng viên có thể truy cập vào đường link sau để cập nhật những thông tin mới nhất.

Comments are closed.

Close Search Window