Впървите години, за да могат моделите с изкуствен интелект като ChatGPT или конкурента му Cohere да дават отговори, подобни на човешките, бяха необходими огромни екипи от евтини работници, които да им помагат да различават основни факти, като например дали дадено изображение е на кола или на морков.
Но по-сложните актуализации на моделите в условията на ожесточена конкуренция вече изискват бързо разширяваща се мрежа от обучители, които имат специализирани познания – от историци до учени, някои от които с докторски степени.
„Преди година можехме да се справим с наемането на бакалаври, които просто да обучават AI как да се подобрява“, казва съоснователят на Cohere Иван Жанг пред Reuters. „Сега имаме лицензирани лекари, които учат моделите как да се държат в медицинска среда, или финансови анализатори, или счетоводители.“
За повечето обучения Cohere, която последно беше оценена на над 5 млрд. долара, работи със стартъп, наречен Invisible Tech. Компанията е един от основните конкуренти на OpenAI и е специализирана в областта на изкуствения интелект за бизнеса.
Стартъпът Invisible Tech наема хиляди обучители, работещи от разстояние, и се превърна в един от основните партньори на редица разработчици на AI, вариращи от AI21 до Microsoft, за обучение на техните модели с цел намаляване на грешките, известни като „халюцинации“.
„Имаме 5000 души в над 100 държави по света, които са доктори на науките, магистри и специалисти по работа със знания“, казва основателят на Invisible Франсис Педраза.
Invisible плаща до 40 долара на час в зависимост от местоположението на работника и сложността на работата. Някои компании като Outlier плащат до 50 долара на час, а друга организация, наречена Labelbox, посочва, че плаща до 200 долара на час за „високо експертни“ теми като квантова физика, но започва с 15 долара за основни теми.
Invisible е създадена през 2015 г. като доставчик на услуги за автоматизация на работните процеси. Тя обслужва компании като тази за доставка на храна DoorDash, за да дигитализира менюто ѝ. Но нещата се променят, когато сравнително неизвестната тогава изследователска компания OpenAI се свързва с нея през пролетта на 2022 г., преди публичното стартиране на ChatGPT.
„OpenAI дойде при нас с проблем, който се състоеше в това, че когато задавате въпрос на ранната версия на ChatGPT, тя „халюцинираше“. Нямаше как човек да се довери на отговорите“, разказва Педраза. „Нуждаеха се от усъвършенстван партньор, който да осигури усилено обучение с обратна връзка от човека“.
Генеративният AI (GenAI) създава ново съдържание въз основа на данните, използвани за обучението му. Понякога обаче той не може да прави разлика между вярна и невярна информация и генерира фалшиви резултати. В един от забележителните примери през 2023 г. чатбот на Google сподели неточна информация за това кой сателит пръв е направил снимки на Земята извън Слънчевата система в промоционален видеоклип.
Цялата статия от Тук