Задача Проработать ведение ворклогов

Проработать ведение ворклогов

Сейчас агент часто забывает записывать ворклоги что и как и по какой задаче сделано, или записывает очень мало информации. Вместо этого он просто проговаривает это пользователю.

Это особенно критично в ресерч-задачах, когда он должен экспериментально выполнять какие-то действия и надо знать что именно он выполнял, вместе с примерами запросов и т.п.

Пока не принял решение какой именно инструмент для этого задействовать, но есть несколько вариантов. Наиболее перспективным видится пост-агент, который будет после завершения ответа смотреть что пользоавтель сказал, что агент сделал и логировать полный отчет. Но это все равно оставляет простор для бездействия. Как вариант, можно добавить более сильную отладку в сами тулзы. У нас же там уже есть поле reasoning, куда агент указыват что и для чего он делает, то есть объясняет зачем он выполняет эту тулзу. Можно еще добавить поле айди задачи, и если он указан, то автоматом логировать результаты. Но это может оказаться избыточным.

Так же можно оперировать тем, что у нас в каждом запросе передается УРЛ страницы, с которой пишется. Если мы находимся на странице задачи, это дополнительный признак, особенно, когда мы работаем сразу с несколькими задачами. Можно в принципе в саму задачу добавить поле отправки сообщения.

Но это все так, идеи.