За підтримки
Interview

Технолог: Децентралізоване збору даних є ключем до протидії домінуванню великої технології.

Ця стаття була опублікована понад рік тому. Деяка інформація може бути неактуальною.

Генеральний директор технологічної компанії пропонує “демократизацію” штучного інтелекту за допомогою децентралізованого збору даних.

АВТОР
ПОДІЛИТИСЯ
Технолог: Децентралізоване збору даних є ключем до протидії домінуванню великої технології.

Децентралізований збір даних: Шлях до штучного інтелекту без упереджень

Технолог і генеральний директор Synesis One, Ісаак Банг, застерігає від “надзвичайно небезпечного” сценарію, коли деякі технологічні гіганти накопичують дані та лідирують у гонці штучного інтелекту (ШІ). Він виступає за “демократизацію” сили ШІ, щоб забезпечити, щоб кінцевий “переможець” триваючої гонки ШІ не став величезною корпорацією.

За словами Банга, частина рішення полягає в тому, щоб віддати пріоритет децентралізованому збору даних замість залежності від великих компаній, зосереджених на даних. Як пояснює Банг у своїх письмових відповідях Bitcoin.com News, децентралізований збір даних дозволяє компаніям уникнути залучення внутрішніх спеціалістів з аналізу даних. Замість цього, вони можуть “запропонувати роботу” загальному пулу цифрових працівників або спеціалістів для завдань аналізу даних.

Цю модель, як вважає Банг, ідеально підходить для компаній, що прагнуть до масштабування, але не мають внутрішніх ресурсів. Окрім комерційних переваг, децентралізований збір даних також допомагає боротися з проблемою упередженості даних, з якою стикаються централізовані технологічні гіганти.

Хоча уряди висловлюють занепокоєння з приводу громадської безпеки у зв’язку з децентралізованим управлінням даними, Банг все ж таки застерігає від широких регламентів, які можуть врешті-решт придушити інновації. Натомість він закликає регуляторів та законодавців вивчити, як “децентралізоване джерело даних може використовуватись”, перед тим як приймати політики.

Додаткові відповіді Банга торкаються конкуренції в галузі ШІ та притаманних ризиків, пов’язаних з використанням ШІ. Нижче наведено відповіді генерального директора Synesis One на поставлені питання.

Bitcoin.com News (BCN): Прогнозується, що розмір ринку ШІ досягне 184 мільярдів доларів до кінця 2024 року, і індустрія ШІ вся заснована на даних. Все обертається навколо того, як отримати, навчити та використовувати дані. Ця ситуація поставила великі компанії, зосереджені на даних, у вигідне становище, враховуючи обсяг даних, які вони накопичували протягом років майже безкоштовно. Що ви думаєте про те, що кілька великих технологічних компаній домінують у царині даних, що, здається, надає їм фору у гонці ШІ?

Ісаак Банг (IB): ШІ — це ключова технологія, що приносить четверту промислову революцію, і її впливи значно ширші, ніж ми можемо собі уявити зараз. Декілька гравців, які домінують, накопичують дані та лідирують у гонці ШІ, є вкрай небезпечним в багатьох аспектах. ШІ не лише дозволить бізнесам стати продуктивнішими та максимізувати свої фінансові результати, але й дозволить урядам удосконалити свої військові можливості як фізично, так і цифрово. “Переможець” гонки ШІ стане домінуючою силою, і важливо зараз вжити заходів, щоб демократизувати силу ШІ на благо всіх.

BCN: Що таке децентралізований збір даних і чим він відрізняється від традиційних методів збору даних?

IB: Традиційно компанії збирають дані від своїх користувачів/клієнтів, які використовують наданий продукт або послугу. Щоб використовувати зібрані дані для ШІ, компанії залучають спеціалістів з обробки даних та інших фахівців для очищення та анотування даних. Традиційні методи збору та підготовки даних ефективні для великих компаній з багатьма користувачами та великим бюджетом. Однак для малих та середніх компаній масштабування потреб у даних буде скрутним.

Децентралізований збір даних – це процес отримання сирих даних або попередньої обробки даних через широку мережу цифрових працівників, які готові і здатні надавати дані чи виконувати роботу з попередньої обробки. Компанії або розробники можуть, без мати користувачів чи внутрішніх спеціалістів з обробки даних, оголошувати нагороду за завдання з обробки даних спільному пулу цифрових працівників або спеціалістів, щоб вони виконали цю роботу. Це дозволяє компаніям масштабуватися без необхідності витрачати величезні ресурси на наймання штатних працівників.

BCN: Чи можете ви пояснити роль людського інтелекту в зборі даних, особливо в завданнях, з якими ШІ не справляється?

IB: Люди мають здатність до логічного мислення. Сьогоднішній ШІ, що використовує машинне навчання, використовує статистичні обчислення для розпізнавання шаблонів, без логічного мислення. З покращенням моделей ШІ зростає потреба у даних вищої якості та даних, специфічних для певної галузі, які стають все ціннішими. Наприклад, загальна LLM не підходить для використання в медичному середовищі. Модель LLM може бути налаштована для конкретної галузі медицини, але для цього знадобляться люди з експертними знаннями в цій галузі. Ця концепція стосується не лише загальних LLM, але й будь-яких інших додатків ШІ зі специфічнішими випадками використання.

BCN: Як може допомогти збір даних у вирішенні проблеми упередженості даних і забезпечити більш різноманітний і репрезентативний набір даних?

IB: Це просто – що більше різноманітний пул постачальників даних та анотувальників даних, то більш різноманітними і репрезентативними будуть дані. У децентралізованій мережі збирання даних постачальники сирих даних та/або анотувальники даних не походять з однієї платформи, компанії, мережі або групи. Це зменшує упередження даних, з яким може зіткнутися централізована компанія.

BCN: Які інноваційні застосування збору даних розширюють можливості, особливо з новими технологіями, такими як ШІ?

IB: Одним із найпрактичніших випадків використання є сфера природної мови. Сучасні компанії є глобальними, і це вимагає, щоб вони були компетентними у наданні такої ж якості послуг і продуктів на всіх мовах ринків, які вони обслуговують. Проте багато з найкращих моделей LLM сьогодні в основному англомовні. Ми бачили, як компанії покладаються на краудсорсинг для різних мов і діалектів, не тільки для ШІ-потреб, таких як локалізація своїх продуктів.

BCN: Хоча багато експертів вважають, що децентралізоване джерело даних – це шлях вперед, регулятори і великі гравці думають інакше. Алегально, однією з причин регуляторних занепокоєнь щодо децентралізованого управління даними є функції нагляду та контролю, тоді як у великих компаній їхнє занепокоєння стосується доходів. На вашу думку, як законодавці повинні підходити до регуляцій, зосереджених на даних, щоб підтримувати інновації, забезпечуючи при цьому громадську безпеку та захист?

IB: Поки всі транзакції з даними фіксуються на блокчейні, прозорість має бути достатньою для задоволення будь-яких питань нагляду та контролю. Якщо регулятори дійсно занепокоєні громадською безпекою та захистом, має бути більше регулювань щодо управління та використання даних централізованими суб’єктами. Замість того, щоб швидко ухвалювати рішення з остраху, законодавці повинні спочатку дізнатися про способи, якими може використовуватись децентралізоване джерело даних. Якщо є зловмисні наміри або використання, тоді вони повинні втрутитися, а не випускати загальні регламенти, які шкодять інноваціям.

Технолог: Децентралізований збір даних є ключем до протидії домінуванню великих технологічних компаній
генеральний директор Synesis One, Ісаак Банг

BCN: Як ви відповідаєте на занепокоєння щодо потенційних ризиків національної безпеки, таких як зловживання вашою платформою для зловмисних дій?

IB: На даний момент ми не бачили жодних зловживань платформою. Дійсно складно бачити будь-які потенційні ризики, які можуть вплинути на національний рівень безпеки. На рівні зберігання даних, Synesis може працювати як з розподіленими рішеннями для зберігання (наприклад, IPFS, Arweave), так і з централізованими рішеннями (наприклад, AWS), отже це залежить від клієнта. На рівні анотації даних, всі проходять перевірку на рівних умовах, і навіть перевірки на рівних умовах можуть бути спеціально оптимізовані клієнтом для запобігання зловмисної поведінки.

BCN: Більшість великих технологічних компаній враховують свої вигоди, переглядаючи потенціал децентралізованого збору даних. Тим не менш, ваш блокчейн-рішення, Synesis One, прагне переосмислити систему. Чи можете ви коротко підкреслити тип революції, яку Synesis One прагне здійснити в індустрії ШІ, з урахуванням основних викликів, з якими ви зіткнулися?

IB: У Synesis ми прагнемо стати найбільшою у світі мережею цифрових працівників, спеціалістів і галузевих експертів, які допомагатимуть у будь-яких потребах компаній у даних для ШІ. Ми вже бачимо зростання попиту на знання експертного рівня для навчання ШІ (наприклад, точне налаштування, RLHF, сирі дані), оскільки ШІ використовують для все більшої кількості випадків використання. Ми хочемо дати можливість будь-якій компанії будь-якого розміру у будь-якій галузі масштабувати свої потреби у даних ШІ, підключаючись до нашої платформи та мережі цифрових експертів з усього світу. Це не лише допоможе компаніям масштабуватися, але й відкриє нові можливості для людей по всьому світу заробляти гроші, надаючи свої знання та навички в Інтернеті.

BCN: Як ви плануєте орієнтуватися у конкурентному середовищі, яке протиставляє ваше рішення великим основним компаніям, які можуть бути готові зробити все можливе для захисту своїх інтересів?

IB: Здивовано, є багато проблемних точок, які основні компанії не вирішили для своїх працівників. Однією з них є платежі, оскільки транскордонні платежі часто є дорогими і повільними. Інша головна проблема – це відсутність прозорості. Це суттєва перевага для нас, оскільки наша система виплат не вимагає мінімального балансу, не має комісій і є миттєвою. Ми прийняли багато незадоволених цифрових працівників, які використовували великих гравців у веб2-індустрії маркування даних. Як тільки ми приєднаємо більше і більше цифрових працівників усіх середовищ і розширимо мережу, наші рішення стануть більш привабливими для потенційних клієнтів.

BCN: Окрім особистих ризиків, з якими стикається ваша компанія, надаючи своє рішення, які вбудовані ризики слід очікувати користувачам вашої платформи і які у вас є плани щодо їх управління?

IB: Одним із найбільших ризиків, з яким стикаються наші користувачі, є невідповідність знань та/або навичок, необхідних для певних кампаній. Деякі дані кампаній є технічними, і якщо користувач не виконує добре, він не буде добре винагородженим. Все, включаючи репутацію користувачів, базується на точності роботи, виконаної користувачем. Деякі завдання вимагають технічних навичок/знань або мають круті криві навчання. Тому будь-який новий користувач на платформі повинен очікувати, що йому потрібно буде витратити деякий час на вивчення того, як виконувати частину кампаній/завдань даних. Ми постійно оновлюємо та створюємо нові навчальні та тренувальні матеріали для нових і існуючих користувачів, щоб ми могли проводити їх у виконанні кращих результатів. Це вигідно для всіх, якщо користувач(і) витрачають час на читання та навчання з матеріалу.

Теги в цій статті