Bereitgestellt von
Interview

Technologe: Dezentrale Datensammlung durch Crowdsourcing ist der Schlüssel zur Bekämpfung der Dominanz von Big Tech

Dieser Artikel wurde vor mehr als einem Jahr veröffentlicht. Einige Informationen sind möglicherweise nicht mehr aktuell.

Ein Tech-CEO schlägt vor, KI zu „demokratisieren“ durch den Einsatz von dezentralem Daten-Crowdsourcing.

GESCHRIEBEN VON
TEILEN
Technologe: Dezentrale Datensammlung durch Crowdsourcing ist der Schlüssel zur Bekämpfung der Dominanz von Big Tech

Dezentrales Daten-Crowdsourcing: Ein Weg zu einer biasfreien KI

Technologe und CEO von Synesis One, Isaac Bang, warnt vor dem “extrem gefährlichen” Szenario, in dem einige Technologieriesen Daten horten und das Rennen um die Künstliche Intelligenz (KI) anführen. Er plädiert für die “Demokratisierung” der KI-Macht, um sicherzustellen, dass der letztendliche “Gewinner” des aktuellen KI-Rennens nicht zu einem Industriegiganten wird.

Laut Bang liegt ein Teil der Lösung darin, dezentrales Daten-Crowdsourcing gegenüber der Abhängigkeit von großen datenfokussierten Unternehmen zu priorisieren. Wie Bang in seinen schriftlichen Antworten an Bitcoin.com News erklärt, ermöglicht dezentrales Daten-Crowdsourcing Unternehmen, auf die Nutzung interner Datenwissenschaftler zu verzichten. Stattdessen können sie Aufgaben an einen allgemeinen Pool digitaler Arbeitskräfte oder Spezialisten für Datenanalysetätigkeiten “vergaben”.

Dieses Modell, glaubt Bang, ist ideal für Unternehmen, die skalieren möchten, aber über keine internen Ressourcen verfügen. Über den kommerziellen Vorteil hinaus hilft dezentrales Daten-Crowdsourcing auch bei der Bekämpfung der Datenverzerrungsproblematik, der zentralisierte Technologieriesen gegenüberstehen.

Während Regierungen Bedenken hinsichtlich der öffentlichen Sicherheit bei der dezentralen Datenverwaltung äußern, warnt Bang dennoch vor umfassenden Vorschriften, die letztendlich Innovationen ersticken könnten. Stattdessen fordert er Regulierungsbehörden und Gesetzgeber auf, zu untersuchen, wie “dezentrales Daten-Sourcing genutzt wird und genutzt werden kann”, bevor sie Richtlinien erlassen.

Weitere Antworten von Bang befassen sich mit dem Wettbewerb in der KI-Industrie und den inhärenten Risiken, die mit der Nutzung von KI verbunden sind. Nachfolgend finden Sie die Antworten des Synesis One-CEOs auf die gestellten Fragen.

Bitcoin.com News (BCN): Der Markt für KI wird voraussichtlich bis Ende 2024 auf 184 Milliarden Dollar anwachsen, und die KI-Branche dreht sich alles um Daten. Alles dreht sich darum, wie man Daten erwirbt, trainiert und nutzt. Diese Situation hat großen datenfokussierten Unternehmen einen Vorteil verschafft, da sie über Jahre hinweg fast kostenlos eine Vielzahl von Daten gesammelt haben. Was halten Sie davon, dass einige große Technologieunternehmen das Datensystem dominieren, was ihnen scheinbar einen Vorsprung im KI-Rennen verschafft hat?

Isaac Bang (IB): KI ist die Schlüsseltechnologie, die die vierte industrielle Revolution einleitet, und ihre Auswirkungen sind weit größer, als wir uns derzeit vorstellen können. Einige dominante Akteure, die die Daten horten und das KI-Rennen anführen, sind auf vielerlei Weise extrem gefährlich. Nicht nur wird KI-Technologie Unternehmen ermöglichen, produktiver zu werden und ihre Gewinne zu maximieren, sondern sie wird auch Regierungen in die Lage versetzen, ihre militärischen Fähigkeiten sowohl physisch als auch digital zu verbessern. Der „Gewinner“ des KI-Rennens wird eine dominante Kraft sein, und es ist entscheidend, dass wir jetzt Maßnahmen ergreifen, um die Macht der KI zum Wohl aller zu demokratisieren.

BCN: Was ist dezentrales Daten-Crowdsourcing und wie unterscheidet es sich von traditionellen Methoden der Datenerfassung?

IB: Traditionell sammeln Unternehmen Daten von ihren Nutzern/Kunden unter Verwendung des bereitgestellten Produkts oder Dienstes. Um die gesammelten Daten für KI zu nutzen, beschäftigen Unternehmen Datenwissenschaftler und andere Spezialisten, um die Daten zu bereinigen und zu annotieren. Die traditionellen Methoden der Datenerfassung und -aufbereitung sind effizient für große Unternehmen mit vielen Nutzern und viel Geld. Jedoch wird es für kleinere und mittlere Unternehmen schwierig sein, ihre Datenbedürfnisse zu skalieren.

Dezentrales Daten-Crowdsourcing bedeutet, Rohdaten oder Datenvorverarbeitung durch ein großes Netzwerk digitaler Arbeitskräfte zu beschaffen, die bereit und in der Lage sind, die Daten oder Vorarbeit zu leisten. Unternehmen oder Entwickler können, ohne Nutzer oder interne Datenwissenschaftler zu haben, ein Kopfgeld für Datentasks bei einem allgemeinen Pool digitaler Arbeitskräfte oder Spezialisten platzieren, um die Datenarbeit zu erledigen. Dies ermöglicht es Unternehmen zu skalieren, ohne immense Summen an Geld und Zeit in die Einstellung interner Mitarbeiter zu investieren.

BCN: Können Sie die Rolle der menschlichen Intelligenz im Daten-Crowdsourcing, insbesondere bei Aufgaben, bei denen KI Schwierigkeiten hat, erklären?

IB: Menschen haben die Fähigkeit, logisches Denken anzuwenden. KI, die heute maschinelles Lernen nutzt, verwendet statistische Berechnungen, um Muster zu erkennen, ohne logisches Denken. Mit der Verbesserung von KI-Modellen wird der Bedarf an hochwertigeren Daten und domänenspezifischen Daten immer wertvoller. Zum Beispiel ist ein allgemeines LLM nicht geeignet für den Einsatz im medizinischen Bereich. Das LLM könnte für ein bestimmtes medizinisches Fachgebiet feinabgestimmt werden, aber dazu wären Menschen mit Expertenkenntnissen in diesem Bereich erforderlich. Dieses Konzept gilt nicht nur für allgemeine LLMs, sondern auch für alle anderen KI-Anwendungen mit spezifischeren Anwendungsfällen.

BCN: Wie kann Daten-Crowdsourcing helfen, die Herausforderung der Datenverzerrung anzugehen und einen vielfältigeren und repräsentativeren Datensatz zu gewährleisten?

IB: Es ist einfach – je vielfältiger der Pool der Datenanbieter und Datenannotatoren, desto vielfältiger und repräsentativer werden die Daten sein. In einem dezentralen Crowdsourcing-Netzwerk stammen die Anbieter der Rohdaten und/oder Datenannotatoren nicht von einer Plattform, einem Unternehmen, einem Netzwerk oder einer Gruppe. Dies reduziert die Datenverzerrung, der ein zentrales Unternehmen ausgesetzt sein könnte.

BCN: Was sind einige innovative Anwendungen von Daten-Crowdsourcing, die die Grenzen des Möglichen verschieben, insbesondere mit aufkommenden Technologien wie KI?

IB: Eines der praktischsten Anwendungsfälle ist im Bereich der natürlichen Sprache. Unternehmen sind heutzutage global aufgestellt, und dies erfordert, dass Unternehmen in der Lage sind, in allen Sprachen der Märkte, die sie bedienen, die gleiche Qualität von Dienstleistungen und Produkten zu bieten. Allerdings sind viele der derzeit am besten funktionierenden LLMs hauptsächlich auf Englisch basierend. Wir haben gesehen, dass Unternehmen auf Crowdsourcing für verschiedene Sprachen und Dialekte angewiesen sind, nicht nur für KI-Anforderungen, sondern auch für die Lokalisierung ihrer Produkte.

BCN: Während viele Experten glauben, dass dezentrales Daten-Sourcing der richtige Weg ist, denken Regulierer und die großen Akteure anders. Angeblich ist eine der Gründe für regulatorische Bedenken über dezentrale Datenverwaltung die Überwachungs- und Aufsichtsfunktion, während sich große Unternehmen um ihre Einnahmen sorgen. Ihrer Meinung nach, wie sollten die Gesetzgeber die datenfokussierten Vorschriften gestalten, um Innovation zu unterstützen und gleichzeitig die öffentliche Sicherheit und Sicherheit zu gewährleisten?

IB: Solange alle Datenrichtlinien auf Blockchain festgehalten werden, sollte die Transparenz ausreichen, um jegliche Überwachungs- und Aufsichtsbedenken zu beheben. Wenn die Regulierer wirklich besorgt um die öffentliche Sicherheit und den Schutz sind, sollte es mehr Regulierung für das Management und die Nutzung von Daten durch zentrale Einrichtungen geben. Anstatt voreilige Schlüsse zu ziehen, sollten die Gesetzgeber zunächst die Möglichkeiten lernen, wie dezentrales Daten-Sourcing genutzt wird und genutzt werden kann. Wenn es böswillige Absichten oder Nutzungen gibt, sollten sie eingreifen, anstatt pauschale Vorschriften zu erlassen, die Innovationen schaden.

Technologe: Dezentrales Daten-Crowdsourcing ist der Schlüssel, um die Dominanz der Big Tech zu bekämpfen
CEO von Synesis One, Isaac Bang

BCN: Wie gehen Sie mit Bedenken hinsichtlich potenzieller nationaler Sicherheitsrisiken um, wie z.B. dem Missbrauch Ihrer Plattform für böswillige Aktivitäten?

IB: Derzeit haben wir keinen Missbrauch der Plattform festgestellt. Es ist schwierig, wirklich potenzielle Risiken zu erkennen, die ein Missbrauch auf nationaler Sicherheitsebene haben könnte. Auf der Ebene der Datenspeicherung kann Synesis sowohl mit verteilten Speicherlösungen (z.B. IPFS, Arweave) als auch zentralisierten Lösungen (z.B. AWS) arbeiten, daher liegt es beim Kunden. Auf der Ebene der Datenannotation durchläuft jeder eine Peer Review und sogar die Peer Reviews können vom Kunden spezifisch optimiert werden, um böswilliges Verhalten zu verhindern.

BCN: Die meisten Big Tech-Unternehmen berücksichtigen ihre Gewinne, wenn sie das Potenzial von dezentralem Daten-Sourcing überprüfen. Dennoch will Ihre Blockchain-Lösung, Synesis One, das System neu definieren. Können Sie kurz hervorheben, welche Art von Revolution Synesis One in die KI-Branche bringen möchte und welche großen Herausforderungen Sie bisher bewältigt haben?

IB: Bei Synesis streben wir an, das größte digitale Arbeitskräftenetzwerk von Spezialisten und domänenspezifischen Experten zu sein, das alle KI-Datenbedürfnisse von Unternehmen unterstützt. Wir sehen bereits eine steigende Nachfrage nach Expertenwissen für das Training von KI (z.B. Fine-Tuning, RLHF, Rohdaten), da KI für immer mehr Anwendungsfälle genutzt wird. Wir wollen Unternehmen jeder Größe in jedem Bereich in die Lage versetzen, ihre KI-Datenbedürfnisse zu skalieren, indem sie auf unsere Plattform und unser Netzwerk digitaler Experten weltweit zugreifen. Dies wird Unternehmen nicht nur helfen zu skalieren, sondern auch neue Möglichkeiten für Menschen auf der ganzen Welt schaffen, indem sie online ihr Wissen und ihre Fähigkeiten anbieten können.

BCN: Wie beabsichtigen Sie, das Wettbewerbsumfeld zu bewältigen, das Ihre Lösung gegen große, etablierte Datenmanagementunternehmen ausspielt, die möglicherweise bereit sind, alles zu tun, um ihre Interessen zu schützen?

IB: Überraschenderweise gibt es viele Schmerzpunkte, die die etablierten Unternehmen für ihre Arbeiter nicht gelöst haben. Einer davon betrifft Zahlungen, da grenzüberschreitende Zahlungen oft teuer und langsam sind. Ein weiteres großes Problem ist der Mangel an Transparenz. Dies ist ein großer Vorteil für uns, da unser Auszahlungssystem keinen Mindestbetrag erfordert, keine Gebühren hat und sofort ist. Wir haben viele frustrierte digitale Arbeitskräfte an Bord, die die großen Akteure im Web2-Datenkennzeichnungsbereich genutzt haben. Da wir immer mehr digitale Arbeitskräfte aus allen Bereichen einbinden und das Netzwerk aufbauen, werden unsere Lösungen für potenzielle Kunden immer attraktiver.

BCN: Abgesehen von den persönlichen Risiken, denen Ihr Unternehmen bei der Bereitstellung seiner Lösung ausgesetzt ist, welche inhärenten Risiken sollten Nutzer Ihrer Plattform erwarten und welche Pläne haben Sie, um diese zu handhaben?

IB: Eines der größten Risiken, denen unsere Nutzer ausgesetzt sind, ist das Missverhältnis von Wissen und/oder Fähigkeiten, die für bestimmte Kampagnen benötigt werden. Einige der Datenkampagnen sind technisch und wenn ein Nutzer nicht gut abschneidet, wird er nicht gut belohnt. Alles, einschließlich des Rufes eines Nutzers, basiert auf der Genauigkeit der von den Nutzern bereitgestellten Arbeit. Einige Aufgaben erfordern technische Fähigkeiten/Kenntnisse oder haben steile Lernkurven. Daher sollte jeder neue Nutzer auf der Plattform damit rechnen, einige Zeit damit zu verbringen, zu lernen, wie man einige der Kampagnen/Datenaufgaben erledigt. Wir aktualisieren und produzieren kontinuierlich neue Bildungs- und Schulungsmaterialien für neue und bestehende Nutzer, damit wir sie anleiten können, besser abzuschließen. Dies kommt allen zugute, solange der/die Nutzer Zeit darauf verwenden, das Material zu lesen und daraus zu lernen.

Tags in diesem Artikel