Мій індивідуальний посібник щодо практичного використання LLM-моделей в економічному аналізі та фінансовому моделюванні.
Григорій Кукуруза — економіст і один із засновників Ukraine Economic Outlook.
Богдан Кукуруза, учащийся факультета компьютерных наук в Университете Дублин Сити.
Мій особистий гайд по прикладному застосуванню LLM-моделей для економічного аналізу / фінансового моделювання.
Яка унікальність цього тексту?
Ось кілька ключових прикладів використання моделей LLM з мого досвіду:
Етап-1. Пошук даних, робота з джерелами та наповнення банку даних для подальшого аналізу
Зовнішні джерела. Я не ризикую "запитувати" інформацію в LLM-моделях, щоб уникнути ризику "галюцинацій". Лише парсинг ними даних із зовнішніх джерел.
Введіть свій пошуковий запит, зазначивши деталі щодо бажаного результату. В процесі роботи я активую всі чотири моделі для виконання пошуку. Потім збираю отримані результати в систему Claude і формую звіт. Зазвичай режим Agent обробляє приблизно 10-15 джерел, але робить це з максимальною ретельністю. Модель Gemini - Deep Research, в залежності від конкретного завдання, може працювати з кількістю джерел від менше ніж 10 до 120-150. Grok функціонує аналогічно: для загальних запитів може обробляти близько 60-100 джерел. Його перевага полягає в тому, що серед безкоштовних версій він безсумнівно є найкращим для обробки джерел. Claude, залежно від характеру запиту, може обробляти від 50 до 400 джерел.
Мова запиту. Кожна LLM-модель прагне оптимізувати використання своїх ресурсів. Якщо ви вважали, що модель аналізує інформацію одночасно на всіх мовах, а потім перекладає результати на мову запиту, то це не зовсім так. Обробка джерел в першу чергу відбувається на мові запиту. В подальшому, в залежності від контексту, можуть бути залучені найбільш поширені мови, пов’язані з темою (наприклад, англійська, німецька, французька, китайська), або ж може здійснюватися контекстний пошук іншими локальними мовами. Кожна модель має свій специфічний підхід до пріоритизації мов, тому цей аспект є критично важливим для розуміння. Наприклад, за запитом на короткий звіт про вугільну галузь, ви можете отримати матеріал про інтеграцію шахт самопроголошених ДНР і ЛНР в російську енергетичну систему (з власного досвіду).
Внутрішні джерела. Формально всі інструменти дозволяють підключити доступи до Google Drive. У Claude desktop взагалі широкий арсенал інструментів. Але на практиці доводиться працювати з різних девайсів напряму з "зоопарком" файлів різних форматів. Для "легких" файлів до 5 мб працює все. З 20+ мб у мене справлявся лише Gemini. Grok - страшно б'ється і лагає при завантаженні файлів у принципі.
Аудіообробка. Офлайн-зустрічі та стратегічні сесії залишаються важливою частиною нашого життя. Gemini Pro — унікальний інструмент, що швидко трансформує аудіозаписи в текст і автоматично формує стислий структурований документ з усіма необхідними даними.
Окремий пункт - робота з реєстрами. ChatGPT, Gemini та Grok мають безлімітні доступи до реєстрів з лімітованим доступом (наприклад, з фінансовою звітністю компаній). Тому за ЄДРПОУ / European Unique Identifier / іншим ідентифікатором юрособи можна легко знайти фінансову звітність компанії.
Етап-2. Обробка та аналіз даних, формування звіту та висновків.
Основне правило - всі LLM-моделі схожі на непоганого, але дуже вузькоспеціалізованого спеціаліста, який у процесі підготовки звіту обов'язково допустить 1-2 критичні помилки, які на першій ітерації вашої спільної роботи дають абсолютно непридатний для застосування результат. Фраза-мем: "Так, дійсно, ти правий. Зараз я перероблю звіт" - це насправді рулетка, в якій або Ви знайдете помилку, або Ваш клієнт.
Тому якщо Ви готові взяти на себе ризик, відповідальність за аналіз помилок у підготовленому звіті, тоді є зміст грати в цю гру. Раніше ~70% (старі часи моделі о3 ChatGPT рік тому) інформації в підготовленому репорті було вірними, наразі ця пропорція зросла до ~90-95%. Питання - чи вистачить Вашої компетенції виявити 5% помилок серед всього масиву.
Хочу звернути вашу увагу на новий термін - workslop. Це означає контент, створений штучним інтелектом, який на перший погляд виглядає завершеним, проте насправді вимагає істотних доопрацювань.
З важливих плюсів: рівень роботи кращих LLM-моделей у напрямку "розмірковування" вже вище junior-аналітика.
Що стосується моделей, то однозначним фаворитом для мене є Claude Opus 4.5, який поєднує функції веб-пошуку, розширеного мислення та режим дослідження. Ця модель з’явилася на ринку лише в кінці листопада.
Ця модель відзначається високою якістю в підготовці звітів і демонструє добре організоване, логічне мислення. Вона сама пропонує оптимальні формати для подачі інформації (Word, Excel). Серед її переваг можна виділити бізнес-аналіз, обробку фінансової звітності та економічний аналіз.
Стислий аналіз можливостей, всього за 6 хвилин, але з глибоким змістом:
На другій позиції розташувався GPT 5.2 Thinking (в поєднанні з режимом Deep research), який був випущений 11 грудня. Загалом, він має право на існування, але лише в ролі другого варіанту. Основний його недолік полягає в нестабільності результатів. Іноді модель здатна згенерувати досить якісний звіт, що містить покроковий аналіз, саморефлексію та оригінальні висновки. Однак іноді виникає відчуття втрати часу через затримки в 10-15 хвилин на "роздуми та підготовку".
Третє місце можна віддати одночасно Gemini 3.0 Pro та Grok Expert. Gemini безсумнівно випереджає у сфері обробки документів, їх організації та створення простих та чітких висновків. Однак на цьому його переваги закінчуються. Явним фаворитом Gemini залишається функція Deep Research, проте в інших завданнях я не поділяю захоплення своїх колег. Хоча показники та якісні вимірювання високі, кінцевий результат залишається недостатнім.
Grok Expert, враховуючи, що я не мав жодних позитивних сподівань, справив досить непогане враження. Він демонструє низький рівень Hallucination Rate, найменший після Claude. Однак, серед недоліків слід зазначити, що система може "зависати" і втрачати ваш запит, якщо чекати більше години (це неприємно, але, на жаль, трапляється).
Perplexity Лабораторія / Perplexity Глибоке дослідження - теж має право на життя. Однозначно сильний у роботі з файлами (створення екселей, презентацій), але дуже схожий на клон Claude.
Для об'єктивності додаю огляд проведених замірів ефективності різних моделей (хоч він і не співпадає з моїми спостереженнями):
Невелике нагадування: завжди звертайте увагу на перемикач моделей – основна мета LLM полягає в тому, щоб зменшити витрати ресурсів на вас. Тому варто уникати вибору режиму "Auto" під час налаштування, оскільки найкращим, хоч і повільнішим, є режим, що вимагає найбільше розуміння.
Етап 3. Обробка файлів формату (xlsx), дослідження зв'язків і формул, основи фінансового моделювання.
Основний функціонал (використання одразу в Excel). Якщо коротко, до практичного масового використання продукт ще не готовий. Але в рамках обережного тестування цілком прийнятно.
У цьому раунді з нами залишилися лише Claude і ChatGPT, інтегровані в платформу Microsoft 365 Frontier (основна увага приділяється Excel). Це експериментальний доступ до агентів Copilot, які базуються на конкурентних LLM з можливістю внутрішнього вибору.
Переваги: відкритий код, що дозволяє відстежувати алгоритми LLM-моделі. Дуже швидка та зручна обробка великих Excel-документів (що є значно складнішим при безпосередній роботі в інтерфейсі LLM), функції для аналізу даних, інтеграції та перевірки формул. Claude має "професійний досвід", що забезпечує ефективну роботу з фінансовими моделями.
Короткий огляд побудови фінансової моделі, прогнозування доходу, зарплатного фонду, візуалізації через дашборд.
Отже, аналітики з Big Four і Big Three, безсумнівно, досягнуть кращих результатів. Але скільки часу це займе? Можливо, доцільніше спростити процес і стартувати з уже готового шаблону. Найголовніше питання полягає в тому, що робити компаніям, які не мають спеціалістів з таким рівнем кваліфікації? Саме тому багато аспектів роботи Агентів в Excel можуть бути виправдані.
Обмежені можливості (взаємодія з файлами через звичайний інтерфейс користувача).
Ви можете використовувати Claude та Perplexity для своїх завдань (можливо, я неправий стосовно ChatGPT, але це той досвід, який я здобув останніми місяцями; за моїми спостереженнями, ChatGPT значно відстає у роботі з файлами xlsx. Коли мова йде про аналіз формул, складання опису їх функцій та перевірку на можливі помилки, позитивних результатів не було).
Claude та Perplexity (Лабораторний Режим) ефективно аналізують xlsx-документи, що містять кілька сторінок, перевіряючи логічну структуру моделей та взаємозв'язки між формулами. Зважаючи на те, що клієнти часто змінюють свої вимоги на кшталт "дуже терміново потрібно – потім не потрібно, а знову терміново, навіть опівночі", ці інструменти стають ідеальним способом для оновлення знань про файл або інтеграції в проект.
Етап 4. Впровадження і опір з боку співробітників.
По-перше, варто висловити щиру подяку всім інфобізнесменам, які в 2023-2024 роках створили нереалістично завищені сподівання щодо технологій. На Заході це було зроблено для збільшення капіталізації, а у нас — з метою продажу курсів, інтеграцій та майстер-класів. Тепер, завдяки цим тенденціям, питання автоматизації на основі LLM не обговорюється в належних колах. Проте, ми змушені враховувати існуючі умови і прагнути підвищення продуктивності співробітників будь-якими засобами.