Дізнайтеся Сумісність За Знаком Зодіаку
Що можуть знайти дослідники серед 32 мільйонів URL-адрес, які Facebook щойно опублікував у Social Science One?
Перевірка Фактів

Автор: Сергій Нівенс/Shutterstock
Соціальні науки один , неприбуткова комісія, створена в 2018 році для встановлення конкретних партнерських відносин між науковцями та багатими даними установами, такими як Facebook, тепер має 32 мільйони окремих посилань, витягнутих із мережі соціальних мереж Марка Цукерберга, для проведення досліджень.
Після несподіваної затримки майже на рік щось, що створило засмучений разом із засновниками проекту коаліція дослідників нарешті отримала від Facebook те, що вважається «одним із найбільші набори посилань коли-небудь створений для академічних досліджень».
Принаймні так сказав IFCN Соломон Мессінг, колишній директор лабораторії даних Pew Researcher Center, а тепер менеджер із науки про дані Social Science One.
Тепер групи дослідників, відібрані з усього світу, зможуть використовувати набір даних для визначення тенденцій, закономірностей та популярних тем у світі контенту на Facebook.
Відповідно до платформи, набір даних включає кількість публічних публікацій URL-адрес, дату їхнього першого опублікування, дату першої перевірки фактів, країну, в якій вони найбільше розповсюджувалися, а також підсумок фактичного вмісту. міститься в URL-адресі.
Він також містить дані про взаємодію з користувачем, включаючи кількість разів, коли користувач позначав URL-адресу як містить неправдиві новини, і кількість разів, коли URL-адресу було опубліковано без фактичного натискання.
Facebook заявила, що вибрала ці точки даних, оскільки вони вважаються індикаторами дезінформації. Відтепер дослідники можуть використовувати їх, щоб зрозуміти типи тем, які домінують на платформі, або створити моделі машинного навчання на основі цих шаблонів.
Щоб отримати доступ до набору з близько 32 мільйонів URL-адрес, вчені повинні отримати схвалення своїх проектів комісією Social Science One. Прийняті пропозиції можуть отримати фінансування, дані та інші переваги. І всі отримані роботи можуть бути опубліковані за бажанням дослідника, без будь-яких додаткових обмежень з боку Facebook чи комісії.
«Ми продовжуємо надавати додаткові дані таким чином, щоб захистити конфіденційність людей», — сказав Мессінґ. «Цей набір даних дозволить дослідникам відповісти на важливі питання про дезінформацію та роль соціальних медіа в суспільстві».
Очікування високі.
Затримка доставки даних
У квітні 2018 р., коли Facebook оголосила це було партнерство з науковцями, щоб надати їм цінні дані для дослідження дезінформації, передбачалося, що ці набори даних зайняти деякий час готуватися. Але не так довго.
У серпні Buzzfeed News повідомили що спонсори Social Science One, включаючи Democracy Fund, William and Flora Hewlett Foundation, John S. and James L. Knight Foundation, Charles Koch Foundation та Omidyar Network, погрожують вийти з проекту через затримку.
Згідно зі звітом, вони дали Facebook крайній термін до 30 вересня, щоб поділитися обіцяними наборами даних, інакше проект завершиться.
Однак у січні Social Science One повідомила у своєму блозі, що Facebook знадобиться більше часу, щоб опублікувати набір даних URL-адрес, посилаючись на проблеми конфіденційності.
«Facebook не тільки має відповідати новому Загальному регламенту про захист даних Європейського Союзу, а також аналогічним законам про конфіденційність у юрисдикціях по всьому світу, але також має відповідати указу Facebook про згоду з Федеральною торговою комісією США», – йдеться у повідомленні. допис у блозі читати. «Через безпрецедентний характер нашого проекту Facebook рухається повільно й обережно, щоб переконатися, що наш проект відповідає всім відповідним правовим інструкціям».
Набір даних був опублікований у середині вересня, якраз раніше терміну, про який повідомляє Buzzfeed.
Як вирішувалися проблеми конфіденційності?
За даними Facebook, до URL-адрес, які вводили набір даних, було додано різну конфіденційність. Це означає, що внесок будь-якої особи до даних був замаскований.
Facebook заявила, що характеризує диференційну конфіденційність як додатковий «статистичний шум», який забезпечує людям додатковий рівень захисту та захищає їх від кібератак.
Яке дослідження стає можливим завдяки цьому набору даних?
Попередня версія набору даних URL-адрес, яка була доступна для схвалених дослідників через платформу соціального моніторингу CrowdTangle, вже використовувалася в вивчення про скоординовану неавтентичну поведінку обміну посиланнями напередодні європейських виборів 2019 року в Італії.
Тепер дослідники зможуть використовувати повний набір даних, щоб краще зрозуміти, які види контенту та теми переважають у Facebook. Вони зможуть визначити закономірності в тому, що поширюється з часом, і потенційно можуть створити моделі машинного навчання, які виявляють дезінформацію.
Facebook повідомила, що дослідники вже давно усвідомлюють необхідність великого та різноманітного набору даних для навчання такої моделі машинного навчання. Цей набір даних URL-адрес є одним із найбільших з існуючих, його розмір становить 7 гігабайт і містить приблизно 32 мільйони URL-адрес і близько 544 мільйонів значень клітинок.
Науковці можуть визначити, як модний контент пов’язаний з політичними подіями та випуском продуктів у Facebook. Інші потенційні теми дослідження включають те, як поляризація, політики та цикли новин відіграють роль у поширенні дезінформації на платформі.