Задача Проработать ведение ворклогов
Проработать ведение ворклогов
Сейчас агент часто забывает записывать ворклоги что и как и по какой задаче сделано, или записывает очень мало информации. Вместо этого он просто проговаривает это пользователю.
Это особенно критично в ресерч-задачах, когда он должен экспериментально выполнять какие-то действия и надо знать что именно он выполнял, вместе с примерами запросов и т.п.
Пока не принял решение какой именно инструмент для этого задействовать, но есть несколько вариантов. Наиболее перспективным видится пост-агент, который будет после завершения ответа смотреть что пользоавтель сказал, что агент сделал и логировать полный отчет. Но это все равно оставляет простор для бездействия. Как вариант, можно добавить более сильную отладку в сами тулзы. У нас же там уже есть поле reasoning, куда агент указыват что и для чего он делает, то есть объясняет зачем он выполняет эту тулзу. Можно еще добавить поле айди задачи, и если он указан, то автоматом логировать результаты. Но это может оказаться избыточным.
Так же можно оперировать тем, что у нас в каждом запросе передается УРЛ страницы, с которой пишется. Если мы находимся на странице задачи, это дополнительный признак, особенно, когда мы работаем сразу с несколькими задачами. Можно в принципе в саму задачу добавить поле отправки сообщения.
Но это все так, идеи.