Cumhachtaithe ag
News

Léarscáileann páipéar “Gaistí Gníomhairí AI” ó DeepMind conas a d’fhéadfadh hackers gníomhairí AI a armáil in aghaidh úsáideoirí

Tá an chéad chreat córasach foilsithe ag taighdeoirí Google Deepmind a chatalógaíonn conas is féidir le hábhar mailíseach gréasáin gníomhairí AI uathrialacha a ionramháil, a fhuadach, agus a armáil i gcoinne a n-úsáideoirí féin.

SCRÍOFA AG
COMHROINN
Léarscáileann páipéar “Gaistí Gníomhairí AI” ó DeepMind conas a d’fhéadfadh hackers gníomhairí AI a armáil in aghaidh úsáideoirí

Príomhphointí:

  • D’aithin taighdeoirí Google Deepmind 6 chatagóir de ghaistí gníomhairí AI, agus shroich rátaí ratha insteallta ábhair 86%.
  • Bhain Gaistí Rialaithe Iompair a dhírigh ar Microsoft M365 Copilot amach 10/10 eis-sreabhadh sonraí i dtástálacha doiciméadaithe.
  • Éilíonn Deepmind oiliúint achrannach, scanóirí ábhair ag am rite, agus caighdeáin nua gréasáin chun gníomhairí a dhaingniú faoi 2026.

Páipéar Deepmind: Is Féidir Gníomhairí AI a Fhuadach Trí Chuimhne Nimhe, Orduithe HTML Dofheicthe

An páipéar, dar teideal “AI Agent Traps,” a scríobh Matija Franklin, Nenad Tomasev, Julian Jacobs, Joel Z. Leibo, agus Simon Osindero, a bhfuil baint acu ar fad le Google Deepmind, agus a cuireadh ar SSRN ag deireadh Mhárta 2026. Tagann sé agus cuideachtaí ag rásaíocht chun gníomhairí AI a imscaradh atá in ann an gréasán a bhrabhsáil, ríomhphoist a léamh, idirbhearta a fhorghníomhú, agus fo-ghníomhairí a chruthú gan mhaoirseacht dhíreach dhaonna.

Áitíonn na taighdeoirí gur dliteanas iad na cumais sin freisin. “Trí an timpeallacht a athrú seachas an tsamhail,” a deir an páipéar, “armálann an gaiste cumais an ghníomhaire féin ina choinne.”

Aithníonn creat an pháipéir sé chatagóir ionsaithe san iomlán, eagraithe de réir cén chuid d’oibriú gníomhaire a ndíríonn siad uirthi. Baineann Gaistí Insteallta Ábhair leas as an mbearna idir an méid a fheiceann duine ar leathanach gréasáin agus an méid a pharsálann gníomhaire AI sa HTML, CSS, agus meiteashonraí bunúsacha.

Ní fheictear treoracha atá folaithe i nótaí tráchta HTML, i gclibeanna inrochtaineachta, nó i dtéacs atá stílithe mar dho-fheicthe riamh do léirmheastóirí daonna, ach cláraíonn siad mar orduithe dlisteanacha do ghníomhairí. Fuair tagarmharc WASP amach go bhféadfadh instealltaí leide simplí, scríofa ag daoine, atá leabaithe in ábhar gréasáin gníomhairí a fhuadach go páirteach i suas le 86% de na cásanna a tástáladh.

Oibríonn Gaistí Ionramhála Séimeantaí ar bhealach difriúil. Seachas orduithe a instealladh, sáithíonn siad an téacs le frámaíocht, comharthaí údaráis, nó teanga luchtaithe go mothúchánach chun an dóigh a réasúnaíonn gníomhaire a chlaonadh. Léiríonn múnlaí móra teanga (LLManna) na claontaí céanna ancaireachta agus frámaíochta a théann i bhfeidhm ar chognaíocht an duine, rud a chiallaíonn gur féidir le hathfhocailiú na bhfíoras céanna aschuir an ghníomhaire atá thar a bheith éagsúil a tháirgeadh.

Téann Gaistí Staid Chognaíoch níos faide trí bhunachair aisghabhála a úsáideann gníomhairí mar chuimhne a nimhiú. Léiríonn taighde a luaitear sa pháipéar gur féidir, trí níos lú ná dornán doiciméad optamaithe a instealladh i mbonn eolais, freagraí gníomhairí a atreorú go hiontaofa do cheisteanna spriocdhírithe, agus go sáraíonn roinnt rátaí ratha ionsaithe 80% le níos lú ná 0.1% truaillithe sonraí.

Fágann Gaistí Rialaithe Iompair an caolchúis ar leataobh agus díríonn siad go díreach ar shraith gnímh an ghníomhaire. Ina measc tá seichimh jailbhriste leabaithe a sháraíonn ailíniú sábháilteachta nuair a ionghabháiltear iad, orduithe eis-sreafa sonraí a atreoraíonn faisnéis íogair úsáideora chuig pointí deiridh atá faoi smacht ionsaitheora, agus gaistí giniúna fo-ghníomhairí a chuireann iallach ar phríomhghníomhaire gníomhairí páistí comhréitithe a thionscnamh.

Doiciméadaíonn an páipéar cás a bhain le M365 Copilot Microsoft, áit ar chuir ríomhphost amháin a ceapadh go cúramach ar chumas an chórais a sheachaint aicmitheoirí inmheánacha agus a chomhthéacs iomlán pribhléideach a sceitheadh chuig pointe deiridh faoi smacht ionsaitheora. Tá Gaistí Córasacha deartha chun líonraí iomlána gníomhairí a theip ag an am céanna seachas córais aonair.

Ina measc tá ionsaithe plódaithe a shioncrónaíonn gníomhairí i n-éileamh íditheach ar acmhainní teoranta, cascáidí idir-spleáchais samhaltaithe ar Flash Crash an mhargaidh stoc in 2010, agus gaistí ilroinn chumadóireachta a scaipeann ualach mailíseach ar fud foinsí iolracha a fhéachann neamhurchóideach, a athchruthaíonn ina ionsaí iomlán amháin nuair a chomhiomlánaítear iad.

“Tríd an timpeallacht a shíolú le hionchuir atá deartha chun teipeanna ar leibhéal macra a spreagadh trí iompar comhghaolmhar gníomhairí,” a mhíníonn páipéar Google Deepmind, éiríonn sé níos contúirtí de réir mar a éiríonn éiceachórais samhlacha AI níos aonfhoirmí. Tá nochtadh díreach roimh na hearnálacha airgeadais agus cripte mar gheall ar cé chomh domhain is atá gníomhairí algartamacha leabaithe i mbonneagar trádála.

Cuireann Gaistí Duine-sa-Lúb deireadh leis an tacsanomaíocht trí dhíriú ar na maoir dhaonna atá ag faire ar ghníomhairí seachas ar na gníomhairí féin. Is féidir le gníomhaire comhréitithe aschuir a ghiniúint atá innealtóireachta chun tuirse ceadaithe a spreagadh, achoimrí atá dlúth go teicniúil a chur i láthair a cheadódh neamh-shaineolaí gan grinnscrúdú, nó naisc fioscaireachta a chur isteach a fhéachann cosúil le moltaí dlisteanacha. Déanann na taighdeoirí cur síos ar an gcatagóir seo mar cheann atá faoi-iniúchta ach a bhfuiltear ag súil go bhfásfaidh sí de réir mar a mhéadaíonn córais hibrideacha duine-AI.

Deir Taighdeoirí go dTeastaíonn Níos Mó ná Ceartúcháin Theicniúla chun Gníomhairí AI a Dhaingniú

Ní mheasann an páipéar na sé chatagóir seo mar aonraithe. Is féidir gaistí aonair a shlabhrú, a shraitheáil ar fud foinsí iolracha, nó a dhearadh chun gníomhachtú ach amháin faoi choinníollacha sonracha amach anseo. Comhréitíodh gach gníomhaire a tástáladh thar staidéir éagsúla red-teaming a luaitear sa pháipéar ar a laghad uair amháin, agus i roinnt cásanna rinneadh gníomhartha mídhleathacha nó díobhálacha a fhorghníomhú.

Tá Príomhfheidhmeannach OpenAI Sam Altman agus daoine eile tar éis na rioscaí a bhaineann le rochtain neamhsheiceáilte a thabhairt do ghníomhairí ar chórais íogaire a chur in iúl roimhe seo, ach soláthraíonn an páipéar seo an chéad mhapa struchtúrtha de go díreach conas a thagann na rioscaí sin chun cinn i gcleachtas. Éilíonn taighdeoirí Deepmind freagra comhordaithe a shíneann thar thrí réimse.

Ar an taobh teicniúil, molann siad oiliúint achrannach le linn forbairt na samhla, scanóirí ábhair ag am rite, scagairí foinsí roimh ionghabháil, agus monatóirí aschuir ar féidir leo gníomhaire a chur ar fionraí i lár tasc má aimsítear iompar aimhrialta. Ar leibhéal an éiceachórais, molann siad caighdeáin nua gréasáin a ligfeadh do shuíomhanna gréasáin ábhar atá beartaithe le haghaidh tomhaltais AI a mharcáil agus córais cháil a scórálann iontaofacht fearainn.

Cuireann Anthropic srian ar rochtain ar Ghníomhaire Claude i measc borradh uathoibrithe AI sa chripteo

Cuireann Anthropic srian ar rochtain ar Ghníomhaire Claude i measc borradh uathoibrithe AI sa chripteo

Ghearr Anthropic rochtain ar shíntiús Claude do Openclaw ar an 4 Aibreán, rud a bhrúigh úsáideoirí gníomhairí AI cripte chuig billeáil íoc-mar-a-úsáid. read more.

Léigh anois

Ar an taobh dlíthiúil, aithníonn siad bearna cuntasachta: nuair a dhéanann gníomhaire fuadaithe coir airgeadais, ní thairgeann creataí reatha freagra soiléir maidir le cibé an ar oibreoir an ghníomhaire, ar sholáthraí na samhla, nó ar úinéir an fhearainn a thiteann an dliteanas. Leagann na taighdeoirí amach an dúshlán le meáchan d’aon ghnó:

“Tógadh an gréasán do shúile an duine; tá sé á atógáil anois do léitheoirí meaisín.”

De réir mar a luasghéaraíonn glacadh gníomhairí, aistríonn an cheist ó cén fhaisnéis atá ar líne go dtí cad a chuirfear ar chórais AI a chreidiúint fúithi. Is í an athróg oscailte fós an féidir le lucht déanta beartas, forbróirí, agus taighdeoirí slándála comhordú tapa go leor chun an cheist sin a fhreagairt sula dtagann saothrúcháin fíorshaoil ar scála.