Задача Добавить средства чтения PDF

Добавить средства чтения PDF

Ворклоги

Для начала добавил парсер через openrouter с предварительной разбивкой на постраничность. Скорость и стоимость удивили. Время анализа одностраничного документа - около 8 секунд.

А по стоимости - десятые доли цента.

Более объемный документ - 3.2 мегабайта, 32 страницы.

Получилось сильно больше - почти 5 минут.

Но это уже просто недоработка очередности - каждая страница парсилась последовательно, а надо пачками. Надо просто доработать логику, чтобы одна страница не блокировала другую, но при этом и не все сразу отправлялись - а то можно получить ошибки рейт-лимита. Хотя сейчас в текущем проекте сделаю отправку разом, чтобы проверить возникнет когда ошибка рейт-лимита или нет. Чатгпт говорит, что на платные модели openrouter не накладывает своих лимитов, лимиты могут прилететь от конечного провайдера.

Кстати, этот парсинг 32 страниц PDF стоил примерно $0.16

Добавил отправку всех страниц батчем (ну и параметр конечно, можно батчем, а можно последовательно).

В итоге 32 страницы отработало за 21 секунду, вместо 4 с половиной минуты. Стоимость все та же = $.016 за все страницы. Как по мне, так очень хороший результат.