Без човешка намеса: Как автономни агенти въвеждат генеративен AI за масите

Разработчици на световно ниво създават „автономни агенти“, които работят с големи езикови модели (LLM), като GPT-4 на OpenAI, за да решават сложни проблеми.

Макар и съвсем нови, те могат да представляват важен етап в продуктивното прилагане на LLM, съобщава FastCompany.

Обикновено взаимодействаме с GPT-4, като въвеждаме внимателно формулирани подкани в текстовия прозорец на ChatGPT, докато моделът генерира желания от нас резултат.

Но повечето от нас нямат уменията и търпението да седят и да пишат подкана след подкана, насочвайки LLM към отговор на сложен въпрос, като например:

„Какъв е оптималният бизнес план за завладяване на 20% от пазара на лакове за нокти?“

Съвсем естествено, разработчиците мислят за начини да автоматизират голяма част от този процес. Именно тук се появяват автономните агенти. Най-общо казано, те могат да генерират систематична последователност от задачи, по които LLM работи, докато не изпълни предварително зададена „цел“. Автономните агенти вече изпълняват разнообразни задачи, като провеждане на уеб проучвания, писане на код и създаване на списъци със задачи.

Агентите ефективно добавят традиционен софтуерен интерфейс в предната част на голям езиков модел. Този интерфейс може да използва добре познати софтуерни практики, за да насочи езиковия модел към изпълнението на обща цел (например: „намери всички видеоклипове в YouTube за Голямата рецесия и селектирай ключовите моменти“).

Някои хора ги наричат „рекурсивни“ агенти, защото те работят в цикъл, задавайки на LLM въпроси, всеки от които се основава на резултата от предишния, докато моделът не даде пълен отговор.

Твърде много задачи

Основополагащият автономен агент BabyAGI е създаден от Йохей Накаджима, виртуален инвеститор, програмист и експериментатор. Той описва BabyAGI като „автономен агент, който съдържа мениджър на задачи с изкуствен интелект“.

Накаджима, партньор в малката фирма за рисков капитал Untapped Capital първоначално решил да създаде агент, който да автоматизира някои от задачите, които той обичайно изпълнява като рисков инвеститор – проучване на нови технологии и компании и т.н., като възпроизведе собствения му работен процес.

„Събуждам се сутрин и се заемам с първото нещо в списъка, през деня добавям нови задачи, а вечер ги преглеждам и променям приоритетите им, след което решавам какво да правя на следващия ден“, казва той. BabyAGI също така систематично попълва, добавя и променя приоритетите на задачите, които езиковият модел GPT-4 трябва да изпълни.

Осъзнавайки, че творението му може да бъде приложено за всякакви други цели, Накаджима публикува кода на агента в GitHub, за да го използват и други потребители като основа за собствени (по-специализирани) агенти.

Накаджима твърди, че е  вдъхновен от начините, по които други разработчици подобряват BabyAGI. Някои добавят функции за модериране, както и възможност за работа по паралелни задачи, възможност за генериране на допълнителни агенти, както и добавяне на функции за писане на код и роботика.

„Те се объркват“

Агентът Auto-GPT има още по-голяма автономия.

Разработен от Торан Брус Ричардс, той е описан в GitHub като агент, задвижван от GPT-4, който може да търси в интернет по структуриран начин.

Може да създава подзадачи и да стартира нови агенти, които да ги изпълнят. Той използва GPT-4, за да напише свой собствен код, след което може „рекурсивно да отстранява грешки, да развива и да се самоусъвършенства“.

Auto-GPT може да се използва за всякакви проблеми, но примерният случай, описан в GitHub, се отнася до „готвач“, който се опитва да управлява и развива кулинарен бизнес. В примера агентът „Chef-GPT“ „автономно разработва и управлява бизнеси, за да увеличи нетната си стойност“.

Ричардс казва, че първоначално е искал агент с изкуствен интелект, който автоматично да му изпраща по имейл ежедневните новини за изкуствения интелект.

Но в процеса на работа  осъзнал, че съществуващите агенти се борят със „задачи, които изискват дългосрочно планиране“, или „не са в състояние автономно да усъвършенстват подходите си въз основа на обратна връзка в реално време“.

Това разбиране го вдъхновило да създаде Auto-GPT, който, по думите му, „може да прилага разсъжденията на GPT4 към по-широки и по-сложни проблеми, които изискват дългосрочно планиране и множество стъпки“.

На този ранен етап автономните агенти са предимно експериментални. И те имат някои сериозни ограничения, които им пречат да получат това, което искат от големите езикови модели.

Те често се затрудняват да задържат LLM фокусиран върху дадена цел. В края на краищата, LLM не са предсказуеми. Ако например двама потребители напишат една и съща заявка в ChatGPT, те ще получават различни отговори от модела всеки път.

Базираният във Ванкувър разработчик Съли Омар работи върху агент, който се надява да направи пазарно проучване на водоустойчиви обувки, но LLM по някаква причина се разсейва и започва да фокусира вниманието си върху връзките на обувките.

„Те се объркват“, казва Омар.

Според него, разработчиците вероятно ще намерят нови начини да позволят на автономните агенти да поставят зашити около LLM, така че да продължат да изпълняват задачи, без да се отклоняват от зададената цел.

Fast Company припомня, че автономните агенти започнаха да се появяват в GitHub и Twitter едва преди около две седмици. Като се има предвид енергията около генеративния изкуствен интелект и настоящите темпове на развитие, има основания да се смята, че те ще преодолеят ранните си ограничения.

„Фактът, че са минали само няколко дни, означава, че има толкова много неща, които могат да се случат“, казва Омар.

Това е една от основните причини за ранния интерес към  автономните агенти. Те представляват важна стъпка към изкуствения общ интелект, при който системите, управлявани от AI, са достатъчно интелигентни, за да работят сами, без да се нуждаят от човешко участие.

„Ако можете да накарате два ChatGPT да говорят помежду си, те биха могли да говорят вечно, ако получат правилните насоки. Тогава бихте могли да превърнете единия от тях в мениджър на задачи, който да създава задачите, а другия – в изпълнител на задачите… и те просто биха продължили да работят, след като натиснете бутона Go.“, обяснява Накаджима.

AI, който работи самостоятелно, е понятие, което ни кара да се притесняваме почти инстинктивно. Страхуваме се от бъдеще, в което системите на AI ще започнат да работят заедно по-бързо, отколкото хората могат да разберат и за постигане на цели, които може да се разминават с нашите собствени интереси.

Под всеки туит, в който се съобщава за нов автономен агент, ще откриете субтуитове, в които се задава въпросът за възможността агентът и LLM да се разберат и да започнат да причиняват вреда.

Автономните агенти, колкото и обещаващи да са, могат да добавят още повече гориво към убеждението, че технологичната индустрия трябва по някакъв начин да постави разработването на големи езикови модели на „пауза“, докато вероятните резултати и рискове не бъдат по-добре разбрани, обобщава FastCompany.

Източник

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *