Мій індивідуальний посібник щодо практичного використання LLM-моделей в економічному аналізі та фінансовому моделюванні.

#Наука

Григорій Кукуруза — економіст і один із засновників Ukraine Economic Outlook.

Богдан Кукуруза, учащийся факультета компьютерных наук в Университете Дублин Сити.

Мій особистий гайд по прикладному застосуванню LLM-моделей для економічного аналізу / фінансового моделювання.

Яка унікальність цього тексту?

Ось кілька ключових прикладів використання моделей LLM з мого досвіду:

Етап-1. Пошук даних, робота з джерелами та наповнення банку даних для подальшого аналізу

Зовнішні джерела. Я не ризикую "запитувати" інформацію в LLM-моделях, щоб уникнути ризику "галюцинацій". Лише парсинг ними даних із зовнішніх джерел.

Введіть свій пошуковий запит, зазначивши деталі щодо бажаного результату. В процесі роботи я активую всі чотири моделі для виконання пошуку. Потім збираю отримані результати в систему Claude і формую звіт. Зазвичай режим Agent обробляє приблизно 10-15 джерел, але робить це з максимальною ретельністю. Модель Gemini - Deep Research, в залежності від конкретного завдання, може працювати з кількістю джерел від менше ніж 10 до 120-150. Grok функціонує аналогічно: для загальних запитів може обробляти близько 60-100 джерел. Його перевага полягає в тому, що серед безкоштовних версій він безсумнівно є найкращим для обробки джерел. Claude, залежно від характеру запиту, може обробляти від 50 до 400 джерел.

Мова запиту. Кожна LLM-модель прагне оптимізувати використання своїх ресурсів. Якщо ви вважали, що модель аналізує інформацію одночасно на всіх мовах, а потім перекладає результати на мову запиту, то це не зовсім так. Обробка джерел в першу чергу відбувається на мові запиту. В подальшому, в залежності від контексту, можуть бути залучені найбільш поширені мови, пов’язані з темою (наприклад, англійська, німецька, французька, китайська), або ж може здійснюватися контекстний пошук іншими локальними мовами. Кожна модель має свій специфічний підхід до пріоритизації мов, тому цей аспект є критично важливим для розуміння. Наприклад, за запитом на короткий звіт про вугільну галузь, ви можете отримати матеріал про інтеграцію шахт самопроголошених ДНР і ЛНР в російську енергетичну систему (з власного досвіду).

Внутрішні джерела. Формально всі інструменти дозволяють підключити доступи до Google Drive. У Claude desktop взагалі широкий арсенал інструментів. Але на практиці доводиться працювати з різних девайсів напряму з "зоопарком" файлів різних форматів. Для "легких" файлів до 5 мб працює все. З 20+ мб у мене справлявся лише Gemini. Grok - страшно б'ється і лагає при завантаженні файлів у принципі.

Аудіообробка. Офлайн-зустрічі та стратегічні сесії залишаються важливою частиною нашого життя. Gemini Pro — унікальний інструмент, що швидко трансформує аудіозаписи в текст і автоматично формує стислий структурований документ з усіма необхідними даними.

Окремий пункт - робота з реєстрами. ChatGPT, Gemini та Grok мають безлімітні доступи до реєстрів з лімітованим доступом (наприклад, з фінансовою звітністю компаній). Тому за ЄДРПОУ / European Unique Identifier / іншим ідентифікатором юрособи можна легко знайти фінансову звітність компанії.

Етап-2. Обробка та аналіз даних, формування звіту та висновків.

Основне правило - всі LLM-моделі схожі на непоганого, але дуже вузькоспеціалізованого спеціаліста, який у процесі підготовки звіту обов'язково допустить 1-2 критичні помилки, які на першій ітерації вашої спільної роботи дають абсолютно непридатний для застосування результат. Фраза-мем: "Так, дійсно, ти правий. Зараз я перероблю звіт" - це насправді рулетка, в якій або Ви знайдете помилку, або Ваш клієнт.

Тому якщо Ви готові взяти на себе ризик, відповідальність за аналіз помилок у підготовленому звіті, тоді є зміст грати в цю гру. Раніше ~70% (старі часи моделі о3 ChatGPT рік тому) інформації в підготовленому репорті було вірними, наразі ця пропорція зросла до ~90-95%. Питання - чи вистачить Вашої компетенції виявити 5% помилок серед всього масиву.

Хочу звернути вашу увагу на новий термін - workslop. Це означає контент, створений штучним інтелектом, який на перший погляд виглядає завершеним, проте насправді вимагає істотних доопрацювань.

З важливих плюсів: рівень роботи кращих LLM-моделей у напрямку "розмірковування" вже вище junior-аналітика.

Що стосується моделей, то однозначним фаворитом для мене є Claude Opus 4.5, який поєднує функції веб-пошуку, розширеного мислення та режим дослідження. Ця модель з’явилася на ринку лише в кінці листопада.

Ця модель відзначається високою якістю в підготовці звітів і демонструє добре організоване, логічне мислення. Вона сама пропонує оптимальні формати для подачі інформації (Word, Excel). Серед її переваг можна виділити бізнес-аналіз, обробку фінансової звітності та економічний аналіз.

Стислий аналіз можливостей, всього за 6 хвилин, але з глибоким змістом:

На другій позиції розташувався GPT 5.2 Thinking (в поєднанні з режимом Deep research), який був випущений 11 грудня. Загалом, він має право на існування, але лише в ролі другого варіанту. Основний його недолік полягає в нестабільності результатів. Іноді модель здатна згенерувати досить якісний звіт, що містить покроковий аналіз, саморефлексію та оригінальні висновки. Однак іноді виникає відчуття втрати часу через затримки в 10-15 хвилин на "роздуми та підготовку".

Третє місце можна віддати одночасно Gemini 3.0 Pro та Grok Expert. Gemini безсумнівно випереджає у сфері обробки документів, їх організації та створення простих та чітких висновків. Однак на цьому його переваги закінчуються. Явним фаворитом Gemini залишається функція Deep Research, проте в інших завданнях я не поділяю захоплення своїх колег. Хоча показники та якісні вимірювання високі, кінцевий результат залишається недостатнім.

Grok Expert, враховуючи, що я не мав жодних позитивних сподівань, справив досить непогане враження. Він демонструє низький рівень Hallucination Rate, найменший після Claude. Однак, серед недоліків слід зазначити, що система може "зависати" і втрачати ваш запит, якщо чекати більше години (це неприємно, але, на жаль, трапляється).

Perplexity Лабораторія / Perplexity Глибоке дослідження - теж має право на життя. Однозначно сильний у роботі з файлами (створення екселей, презентацій), але дуже схожий на клон Claude.

Для об'єктивності додаю огляд проведених замірів ефективності різних моделей (хоч він і не співпадає з моїми спостереженнями):

Невелике нагадування: завжди звертайте увагу на перемикач моделей – основна мета LLM полягає в тому, щоб зменшити витрати ресурсів на вас. Тому варто уникати вибору режиму "Auto" під час налаштування, оскільки найкращим, хоч і повільнішим, є режим, що вимагає найбільше розуміння.

Етап 3. Обробка файлів формату (xlsx), дослідження зв'язків і формул, основи фінансового моделювання.

Основний функціонал (використання одразу в Excel). Якщо коротко, до практичного масового використання продукт ще не готовий. Але в рамках обережного тестування цілком прийнятно.

У цьому раунді з нами залишилися лише Claude і ChatGPT, інтегровані в платформу Microsoft 365 Frontier (основна увага приділяється Excel). Це експериментальний доступ до агентів Copilot, які базуються на конкурентних LLM з можливістю внутрішнього вибору.

Переваги: відкритий код, що дозволяє відстежувати алгоритми LLM-моделі. Дуже швидка та зручна обробка великих Excel-документів (що є значно складнішим при безпосередній роботі в інтерфейсі LLM), функції для аналізу даних, інтеграції та перевірки формул. Claude має "професійний досвід", що забезпечує ефективну роботу з фінансовими моделями.

Короткий огляд побудови фінансової моделі, прогнозування доходу, зарплатного фонду, візуалізації через дашборд.

Отже, аналітики з Big Four і Big Three, безсумнівно, досягнуть кращих результатів. Але скільки часу це займе? Можливо, доцільніше спростити процес і стартувати з уже готового шаблону. Найголовніше питання полягає в тому, що робити компаніям, які не мають спеціалістів з таким рівнем кваліфікації? Саме тому багато аспектів роботи Агентів в Excel можуть бути виправдані.

Обмежені можливості (взаємодія з файлами через звичайний інтерфейс користувача).

Ви можете використовувати Claude та Perplexity для своїх завдань (можливо, я неправий стосовно ChatGPT, але це той досвід, який я здобув останніми місяцями; за моїми спостереженнями, ChatGPT значно відстає у роботі з файлами xlsx. Коли мова йде про аналіз формул, складання опису їх функцій та перевірку на можливі помилки, позитивних результатів не було).

Claude та Perplexity (Лабораторний Режим) ефективно аналізують xlsx-документи, що містять кілька сторінок, перевіряючи логічну структуру моделей та взаємозв'язки між формулами. Зважаючи на те, що клієнти часто змінюють свої вимоги на кшталт "дуже терміново потрібно – потім не потрібно, а знову терміново, навіть опівночі", ці інструменти стають ідеальним способом для оновлення знань про файл або інтеграції в проект.

Етап 4. Впровадження і опір з боку співробітників.

По-перше, варто висловити щиру подяку всім інфобізнесменам, які в 2023-2024 роках створили нереалістично завищені сподівання щодо технологій. На Заході це було зроблено для збільшення капіталізації, а у нас — з метою продажу курсів, інтеграцій та майстер-класів. Тепер, завдяки цим тенденціям, питання автоматизації на основі LLM не обговорюється в належних колах. Проте, ми змушені враховувати існуючі умови і прагнути підвищення продуктивності співробітників будь-якими засобами.