«برای همۀ علاقهمندان به نوشتن، روزنامهنگاری، علم داده و علوم کامپیوتر»
مقدمه
برای من البته سفر هیجانانگیز آشنایی با روزنامهنگاری داده خیلی اتفاقی شروع شد؛ از چند سال قبل به دادهکاوی علاقهمند شدم، نهچندان اتفاقی خبرنگار شدم و درحالیکه تلاش میکردم بهنحوی این دو فضای بهظاهر بیربط را به هم وصل کنم، با راهنمایی دوستانم در «پیوست» دریافتم که حوزهای با عنوان «روزنامهنگاری داده» وجود دارد!
اما به هر حال، قوانین احتمال هم گویای این هستند که برای کمتر کسی ممکن است این سلسله اتفاقات غیراتفاقی رخ دهد و به همین دلیل تصمیم گرفتهام این داکیومنت درخصوص آشنایی با روزنامهنگاری داده یا دیتاژورنالیسم را برای کسانی بنویسم که ممکن است مثل گذشتۀ من هنوز نمیدانند چطور فضاهای بیربط ذهنشان را به هم ربط دهند، یا دربارۀ روزنامهنگاری داده شنیدهاند و علاقهمندند بیشتر بدانند یا به هر دلیل دیگری علاقهمندند بدانند دیتاژورنالیسم چیست، از کجا آمده، چه کسانی از آن استفاده میکنند، چطور از آن استفاده میشود، و...
تاریخچه: روزنامهنگاری داده چگونه متولد شد؟
[حین نوشتن این داکیومنت برای اولین خوانندگان، این پرسش به وجود اومد که بهتر نبود میگفتی اصلاً داری از چی حرف میزنی؟ این شد که در ویرایشهای اولیه، به بخش ابتدایی تاریخچه، تعریف روزنامهنگاری داده رو هم اضافه کردم. بنابراین...]
آنچه از آن بهعنوان «روزنامهنگاری داده» یا "Data journalism" یا "data-driven journalism" یا به اختصار "DDJ" یاد میشود، حوزهای بینرشتهایست که در واقع از دادههای ساختاریافته مثل جدولها یا دادههای بدون ساختار مثل عکس، فیلم و... به عنوان هستۀ اصلی داستانسرایی استفاده میکند.
تصور میکنم از زمانیکه بشریت نوشتن را آغاز کرد، از دادهها هم برای نوشتن استفاده کرده است. اما جمعآوری، فیلتر کردن، تمیز کردن و تجزیه و تحلیل دادهها در مقیاس بزرگتر در واقع زمانی ممکن شد که اولین کامپیوترها متولد شدند. با این حال، متخصصان حوزۀ روزنامهنگاری داده، آغاز این علم (فن) را از سال 1952 در زمان برگزاری انتخابات امریکا و توسط شبکۀ CBS با انگیزۀ پیشبینی نتیجۀ این رقابت با کمک کامپیوترها میدانند. هرچند گفته میشود که آنها هم در واقع اصلاً از دادهها در کارشان استفاده نکردند و آغاز روزنامهنگاری داده در حقیقت از سال 1967 بوده است؛ زمانیکه روزنامهنگاری به نام "Philip Meyer" (مشغول در "Detroit Free Press") از آن برای تحلیل یک نظرسنجی از ساکنان دیترویت استفاده کرد. سرنوشت روزنامهنگاری داده بعد از این در سکوت ماند تا اینکه چند دهه بعد، در بریتانیا، گاردین از برخی رویکردهای مشابه روزنامهنگاری داده، با اشاره به فعالیتهای مایر در این زمینه، برای تحلیل و بررسی شورشهای نژادی استفاده کرد. [1]
دنبال کردن روزنامهنگاری داده توسط ژورنالیست امریکایی هم در سال 1967 متوقف نشد؛ مایر در دهۀ 1970 با خبرنگارانی از فیلادلفیا در زمینۀ تجزیه و تحلیل الگوهای مجازات در سیستم دادگاه محلی و همچنین در زمینۀ تحلیل و بررسی سوابق ارزیابی دارایی فعالیتهایی انجام داد. او کتابی هم با نام «روزنامهنگاری دقیق» (Precision Journalism: A Reporter's Introduction to Social Science Methods) نوشت که در آن استفاده از تحلیل پایگاه داده و روشهای تحقیق اجتماعی را در گزارش توضیح میدهد.
شاید رفتن به سمت روزنامهنگاری داده توسط روزنامۀ بریتانایی را بشود دلیلی بر وضعیت فعلی این علم (فن) دانست؛ چراکه حالا دانشگاههای کشور انگلستان به شیوههای بسیار تخصصی به این حوزه میپردازند و استادان انگلیسی نیز از نامهای پیشرو در این حوزه هستند.
[خوشبختانه مواجهه با این افراد پیشرو چندان هم سخت نیست. چند ماه از اینکه حوزۀ روزنامه نگاری داده رو شروع کردم، گذشته بود که مکاتبۀ علمی با این افراد رو آغاز کردم. از جمله آقای پاول برادشاو (Paul Bradshaw) استاد دانشگاه بیرمنگام انگلستان و نویسندۀ کتاب «تاریخچۀ روزنامهنگاری داده» ("The history of data journalism") که بهعنوان یک روزنامهنگار بریتانیایی در حوزۀ روزنامهنگاری داده پیشگام شناخته میشه. احتمالاً در بخش دیگهای نقدهایی از او بر برخی گزارشهام رو خواهید خواند.]
با این حال، فقط تعداد کمی از روزنامهنگاران تا اواسط دهۀ 1980 از تکنیکهای تحلیل داده در روزنامهنگاری استفاده کردند تا این که الیوت جاسپین امریکایی با تحلیل دادهها در روایتهای ژورنالیستیش این علم (فن) را بار دیگر به رسمیت شناخت. او بعد از دریافت جایزۀ پولیتزر برای گزارشی به سبک سنتی دربارۀ فساد اتحادیههای کارگری، از دانشگاه کلمبیا برای استفاده از دادهها در ژورنالیسم بورسیه تحصیلی گرفت. در انتهای دهۀ 1980، حدود 50 روزنامهنگار دیگر در سراسر امریکا که اغلب هم با مایر یا جاسپین در این زمینه مباحثه و مشورت داشتند، شروع به استفاده از تجزیه و تحلیل دادهها برای گزارشهای خود کردند. [1]
در این بین نباید از بعضی فعالیتهای جسته و گریختۀ دیگر در این زمینه غافل شد. برای مثال در سال 1849، "New York Tribune" نموداری در یکی از گزارشهاش منتشر کرد که میزان مرگ و میر ناشی از وبا را توضیح میداد.
در دهههای 70 و 80، زمان کار روی ماشینهای محاسباتی ارزانتر شد و پردازش دادهها آسانتر و از آن پس تعداد پروژههایی که به عنوان روزنامهنگاری داده یا روزنامهنگاری دادهمحور شناخته میشوند، افزایش پیدا کرد. [2]
اما پیدایش هوش مصنوعی کار را برای روزنامهنگاران داده از پیش خیلی آسانتر کرده است. آنها حالا دیگر از هوش مصنوعی برای مدیریت داستانسرایی، ردیابی منابع دادههای دریافتی و به روز نگه داشتن داستانهای منتشرشده در وب استفاده میکنند. پروژۀ Arc واشنگتن پست و استودیو Quartz AI هر دو از جمله دستاوردهای اخیر روزنامهنگاری داده هستند که این فناوری را به اندازۀ کافی برای همۀ افراد در اتاق خبر آسان کردهاند.
روزنامهنگاری داده نیازمند چه مهارتهاییست؟
اگر تحلیل مواردی که در نگاه اول ممکن است معنادار نباشند، برای شما حوصلهسربر است، پیشنهاد میکنم به طرف روزنامهنگاری داده و حتی علم داده نروید! اما اگر این کار برای شما همواره تجربۀ خوشایندی بوده و شاید هم مثل من از کودکی به پیدا کردن الگوهای میان اشیاء موجود علاقهمند بودهاید، بهتر است برای اینکه بخواهید یک روزنامهنگار داده شوید، بر روی مواردی که در ادامه خواهم گفت تمرکز بیشتری کنید. [3]
1.مهارت نوشتن: درست است که دادهها بخش مهم روزنامهنگاری داده را تشکیل میدهند اما مهارت خوب نوشتن هم مهم است. مهارت نوشتن به ویژه حین نوشتن مقالاتی با آمارهای پیچیده میتواند بسیار ارزشمند باشد. این مهارتها شامل گرامر، واژگان، داستانسرایی و... است. تعاملی که نویسنده میتواند با داشتن این مهارتها بین مؤلفههای مختلف متن برقرار کند، باعث میشود خواننده اطمینان پیدا کند نوشته، روایتی قانعکننده است.
2.آشنایی با علم داده و ابزارهای آن: ابزارهای مختلفی برای کار با مفاهیم علم داده وجود دارد. مثلاً اکسل، زبان SQL، زبان برنامهنویسی پایتون و غیره. روزنامهنگاران داده میتوانند با استفاده از این دست ابزارها دادهها بهتر جمعآوری و تحلیل و تفسیر کنند.
3.جمعآوری و پردازش دادهها: مهارت جمعآوری دادهها به تهیۀ گزارشهای خبری کمک بیشتری میکند. این روند بازیابی دادهها از منابع مختلف و آمادهسازی آنها برای تجزیه و تحلیل و در عین حال یادداشت اطلاعات ناسازگار یا گمشده را در بر میگیرد. ایجاد راهحلهایی برای شناسایی این تناقضها میتواند تضمین کند که منبعی جامع و دقیق از شواهد داریم. از طریق تجزیه و تحلیل دادهها هم میتوانیم الگوها را شناسایی کنیم.
[تو حوزه تحلیل داده، اصولاً یا یه سری دیتاست برای استفاده داریم یا اینکه باید خودمون دادهها رو جمعآوری کنیم و دیتاست بسازیم. مثلاً اگر تو سطح شبکۀ اینترنت به دنبال تحلیل دادههایی هستیم که تو قالب یه دیتاست قابل استفاده وجود ندارن، میتونیم به سراغ از تکنیکهای وب اسکرپینگ بریم. تو سازمانها هم معمولاً پایگاه دادههای رابطهای وجود داره که با استفاده از تکنیکهای SQL و غیره میتونیم دادههایی که میخوایم رو استخراج کنیم.]
علم داده چیست؟
به گمانم وقت آن رسیده، پیش از آن که بیشتر وارد موضوعات مربوط به روزنامهنگاری داده شویم، کمی هم از علم داده بگوییم؛ بهویژه در زمانهای که به واسطۀ ترند شدن موضوعاتی مثل هوش مصنوعی و یادگیری ماشین، علم داده نیز شهرت زیادی پیدا کرده است. با ترند شدن موضوعات و مشاغل مرتبط با داده، سه عنوان که بیشتر در زبانها میچرخد، گاهی با هم اشتباه گرفته میشود و برای بسیاری این سوال را به وجود میآورد که تفاوت میان آنها چیست؛ مهندسی داده، تحلیل داده و علم داده.
مهندسی داده: مهندسان داده روندهایی (pipeline) را طراحی میکنند که دادهها به نوعی ذخیره، تبدیل و منتقل شوند تا آماده و کاربردی به دست دانشمندان داده برسند. دادهها از منابع مختلفی جمع میشوند و در یک انبارداده ذخیره میشوند که به عنوان یک منبع داده قابل اتکا مورد استفاده قرار بگیرد.
تحلیل داده: تحلیلگران داده تحلیلگران داده، دادهها را سازماندهی میکنند تا روندهایی را شناسایی کنند که میتوانند در تصمیمگیری مفید باشند. این افراد از دانش فنی و حوزۀ خود برای ارائۀ توصیههایی استفاده میکنند که میتواند به رشد کسبوکار کمک کند.
علم داده: دانشمندان داده اغلب با تحلیلگران داده اشتباه گرفته میشوند؛ بهاین دلیل که همپوشانی زیادی در مجموعۀ مهارتهای آنان وجود دارد. با این حال، تفاوت اصلی میان این دو آن است که دانشمندان داده مدلهای یادگیری ماشین (Machine Learning) را میسازند، درحالیکه تحلیلگران داده این کار را نمیکنند. دانشمند داده باید مهارتهایی داشته باشد که بسیار به تحلیلگر شبیه است. آنان باید بدانند چگونه دادهها را جمعآوری کنند و تغییر دهند، آنها را نمایش دهند، رویشان تحلیلهای مختلف انجام دهند و مشکلات تجاری را با کمک دادهها حل کنند.
در کنار تمامی مهارتهای ذکرشده، همچنین دانشمندان داده باید بدانند چگونه مدلهای پیشبینی ایجاد کنند.
...
منابع:
- datajournalism.com/read/longreads/the-history-of-data-journalism
- pinardag-1.gitbook.io/datajournalism/3.what-is-data-journalism-origins-of-data-journalism
- ca.indeed.com/career-advice/career-development/data-journalist