← Blogi

Tehisintellekt, mis ei treeni teie andmetel: miks see on oluline

On küsimus, mida enamik inimesi tehisintellekti tööriistu kasutades ei küsi: mis juhtub sellega, mida ma kirjutan?

Vastus enamiku tehisintellekti teenuste puhul hõlmab treenimist. Teie vestlused, küsimused, üleslaaditud dokumendid – need muutuvad sageli treeningandmeteks järgmise mudeli versiooni jaoks. Teie sõnad aitavad tehisintellekti targemaks muuta. Vastutasuks saate… tegelikult mitte midagi. Välja arvatud teadmine, et teie privaatsed mõtted on nüüd sisse põimunud süsteemi, mida miljonid teised kasutavad.

Mõnele inimesele on see aktsepteeritav vahetus. Teistele – eriti ettevõtetele – on see tehingu katkestaja. Siin on, miks tehisintellekt, mis ei treeni teie andmetel, on oluline ja mida otsida.

Kuidas tehisintellekti treenimine tegelikult toimib

Tehisintellekti keelemudelid õpivad töödeldes tohutul hulgal teksti. Mida rohkem teksti, seda targem mudel. Algse treeningu järel parandavad ettevõtted sageli mudeleid edasi, kasutades tegelike kasutajate vestlusi.

Seda nimetatakse peenhäälestamiseks või tugevdusõppeks. See toimib nii:

  1. Te vestlete tehisintellektiga
  2. See vestlus logitakse ettevõtte serveritesse
  3. Insenerid vaatavad seda üle (või lasavad teisel tehisintellektil üle vaadata) kvaliteedi jaoks
  4. Kasulikud näited valitakse treenimiseks
  5. Järgmine mudeli versioon õpib neist – sealhulgas teie sõnadest

Teie vestlus saab osaks mudeli teadmistest. Ja kui see on seal, ei saa seda eemaldada. Neuronivõrkude treenimisele pole „tagasivõtmist“.

Miks ettevõtted tahavad teie andmeid

Treeningandmete loomine on kallis. Inimeste palgamine kvaliteetse teksti kirjutamiseks maksab raha. Olemasoleva teksti litsentsimine maksab raha. Kuid kasutajate vestlused? Need on tasuta.

Iga kord, kui küsite tehisintellektilt küsimuse, annate mitu asja:

  • Näite, kuidas inimesed päringuid sõnastavad – väärtuslik kavatsuse mõistmiseks
  • Signaali, millised teemad on olulised – väärtuslik prioriseerimiseks
  • Demonstratsiooni, millised vastused on kasulikud – väärtuslik parandamiseks

Seetõttu on paljud tehisintellekti teenused tasuta või odavad. Maksate andmetega, mitte rahaga.

Probleem treeningandmeteks muutumisega

Juhusliku isikliku kasutuse puhul ei pruugi treenimine teid huvitada. Kuid mõelge, mis juhtub, kui teie andmed saavad mudeli osaks:

Teie teave võib teistele ilmuda Tehisintellekti mudelid ei mäleta teksti sõna-sõnalt (tavaliselt), kuid õpivad mustreid. Kui arutate midagi piisavalt ainulaadset, võivad selle fragmendid mõjutada, mida tehisintellekt teistele ütleb.

Kaotate kontrolli jäädavalt Kui andmeid kasutatakse treenimiseks, on need mudeli kaaludesse sisse põimunud. Pole kustutamist. Ettevõttelt „unustamise“ palumine ei tööta, kui need andmed on nüüd jaotatud miljardite parameetrite vahel.

Konfidentsiaalne teave muutub jagatud Kui arutate ärisaladusi, klienditeavet või omandlikke meetodeid, võib see teoreetiliselt mõjutada tehisintellekti vastuseid konkurentidele.

Õiguslik vastutus suureneb Ettevõtetele võib tehisintellekti kasutamine, mis treenib teie andmetel, luua vastutust. Kui kliendi teave mõjutab tehisintellekti väljundeid, kes on vastutav?

Tehisintellekti puhul, mis ei treeni teie andmetel, neid probleeme pole.

Mida „ei treeni teie andmetel“ tegelikult tähendab

Ettevõtted sõnastavad oma poliitikaid hoolikalt. Siin on peamised erinevused:

„Loobumine on võimalik“ Paljud teenused lubavad treenimisest loobuda. Kuid vaikimisi on tavaliselt kaasamine. Ja peate usaldama, et loobumine tõesti töötab kõigis nende süsteemides.

„Ettevõtte tasemel ei treenita“ Mõned ettevõtted lõpetavad treenimise ainult tasuliste ettevõtteklientide andmetel. Tasuta ja põhitaseme kasutajad on endiselt mängus.

„Andmeid säilitatakse turvalisuse eesmärgil“ Isegi kui treenimiseks ei kasutata, võidakse teie andmeid salvestada „usaldus ja turvalisus“ eesmärgil. See tähendab, et inimesed võivad neid ikka lugeda.

„Ei treenita, punkt“ Selgeim poliitika: teie vestlusi ei kasutata mudelite treenimiseks, kunagi, sõltumata tasemest. Seda peaks tähendama tehisintellekt, mis ei treeni teie andmetel.

Lugege peenes kirjas. Nende poliitikate vahe on oluline.

Millal see kõige rohkem loeb

Mõne kasutusjuhtumi puhul on treenimise risk madal. Teiste puhul kriitiline:

Õigusalane töö Kliendi-advokaadi privileeg eksisteerib põhjusega. Vestlused tehisintellektiga õigusküsimustes ei tohiks saada treeningandmeteks, mis võiksid teistes kontekstides ilmuda.

Meditsiinilised arutelud Terviseandmed on tundlikud. HIPAA eksisteerib nende kaitsmiseks. Tehisintellekt, mis treenib teie meditsiinilistel küsimustel, õõnestab seda kaitset.

Äristrateegia Konkurentsiplaanide, hinnastrateegiate või toote tegevuskavade arutamine tehisintellektiga, mis treenib, on sisuliselt edastamine tulevastele konkurentidele.

Kood ja intellektuaalomand Arendajad kasutavad tehisintellekti sageli kodeerimiseks. Kui see kood on omandiline, tähendab sellel treenimine, et tehisintellekt võib teistele sarnaseid mustreid soovitada.

Isiklikud asjad Mõned asjad ütlete ainult tehisintellektile, sest usaldate, et see on privaatne. Treenimine murrab selle usalduse.

Kuidas DentroChat seda läheneb

DentroChat tegutseb selge põhimõtte järgi: teie andmed on teie omad. See tähendab:

  • Ei treenita vestlustel – teie vestlused ei paranda meie mudeleid
  • Ei treenita üleslaaditud failidel – teie dokumendid jäävad teie dokumentideks
  • Ei müü andmeid – me ei ole andmeäris
  • EL-i infrastruktuur – kõik jääb Euroopasse GDPR-i alla

Tehisintellekt on juba treenitud avalikel andmetel. See ei vaja teie privaatseid vestlusi hästi töötamiseks. Oleme ärimudeli lahti sidunud andmete väljavõtmisest.

Maksate teenuse eest. See on tehing. Teie andmed ei ole selle osa.

Küsimused tehisintellekti pakkujatele

Kui hindate tehisintellekti tööriistu ja soovite tehisintellekti, mis ei treeni teie andmetel, küsige neid küsimusi:

  1. Kas minu andmeid kasutatakse treenimiseks? Kunagi? – Saage selge jah või ei.
  2. Mis tasuta tasemega? – Poliitikad erinevad sageli hinna järgi.
  3. Mida säilitatakse ja kui kaua? – Treenimine pole ainus risk.
  4. Kus minu andmeid töödeldakse? – Jurisdiktsioon mõjutab õiguskaitset.
  5. Kas saan andmetöötluslepingu? – Ärikasutuse puhul on see oluline.
  6. Kus see on dokumenteeritud? – Suulised kinnitused ei piisa.

Igasugune kõhklus või ebamäärasus vastustes on punane lipp.

Turg muutub

Varased tehisintellekti teenused käsitlesid kasutajaandmeid ära kasutatava ressursina. Kuid turg küpseb. Rohkem kasutajaid mõistab kompromisse. Rohkem ettevõtteid nõuab selgeid andmepoliitikaid. Regulaatorid jälgivad.

Tehisintellekt, mis ei treeni teie andmetel, muutub konkurentsieeliseks, mitte idealistlikuks seisukohaks. Ettevõtted, mis austavad andmepiire, leiavad kliente, kes seda austust väärtustavad.

See on tervislik. See survestab tööstust mudelite poole, kus kasutajad on kliendid, mitte tooted.

Kokkuvõte

Tehisintellekt on kasulik. See pole küsimus. Küsimus on, mida selle kasutamise eest loobute.

Enamiku tehisintellekti teenuste puhul loobute osast privaatsusest. Teie vestlused muutuvad treeningandmeteks. Teie küsimused aitavad ehitada kellegi teise toote järgmist versiooni. Teie dokumendid imenduvad süsteemi, mida te ei kontrolli.

Tehisintellektiga, mis ei treeni teie andmetel, loobute ainult tellimustasust. Teie vestlused jäävad teie vestlusteks. Teie dokumendid jäävad teie dokumentideks. Tehisintellekt töötab sama hästi – lihtsalt ei võta teie sisenditest väärtust välja.

See pole piirang. See on nii, nagu oleks alati pidanud olema.