Нейросети — горячая тема в бизнесе, но в бухгалтерии они пока слабо распространены. В статье рассказываю о реальной практике их применения в бухгалтерии. Разбираю возможности больших языковых моделей, их ограничения и способы интеграции в рабочий процесс. Показываю, какие задачи уже можно доверить ИИ и почему человеку все равно придется выполнять роль редактора.

Содержание

Нейросети в бухгалтерии: что такое LLM и как они работают

Большие языковые модели (Large Language Model, LLM) третий год на хайпе. Самые известные: ChatGPT, Gemini и Qwen. В России — YandexGPT и сберовский Gigachat. В этом году стрельнули китайский DeepSeek и Grok имени Маска. Такие модели основаны на нейронных сетях с миллиардами параметров, которые обучены на огромных объемах текстовых данных. Они способны понимать, анализировать и генерировать текст на человеческом языке. Естественно, технологию такой мощности бизнес пытается прикрутить к любым процессам. Я заинтересовался, как его можно использовать в бухгалтерии.

Оказалось (ожидаемо), что сотрясания воздуха в сети гораздо больше, чем примеров внедрения или описания решения конкретных задач. В научной литературе больше исследуются возможности прогнозирования с помощью LLM будущего компании на основе финансовой отчетности, чем непосредственно ведения бухгалтерского учета. Накидал направления применения LLM к работе бухгалтера. Некоторые из них уже подтверждены практикой, остальные — мои предположения и гипотезы других исследователей.  

В первой части статьи разберу ограничения LLM. Во второй — техническую реализацию использования LLM в бухгалтерии. В третьей — задачи, которые можно делегировать железякам. Не буду влезать в дебри — объясню только то, что сам понял применительно к практическому применению LLM рядовым пользователем.

Ограничения LLM в бухгалтерии: чего нейросети не могут

Чтобы проверить, что я правильно понял логику работы LLM, попросил прочитать тексты моего давнего приятеля Кирилла Пшинника — CEO онлайн-университета «Зерокодер». Так что, если где слажал — вопросики к нему.

LLM имеют графический пользовательский интерфейс чата. Поэтому сразу возникает вопрос: как прикрутить чат к решению бухгалтерских задач? Конечно, можно задавать вопросы в надежде получить консультацию от всезнающего помощника. Но, во-первых хочется, чтобы он не только консультировал, но и сам делал работу за бухгалтера. А во-вторых, даже такая идея «в лоб» решается плохо.

Вот причины этого:

  1. LLM не разбираются в законодательстве. Они не проверяют актуальность нормативки, на которую ссылаются. Им неизвестна иерархия применения норм права. Дать пользователю хоть какой-нибудь ответ для них приоритетнее, чем ответить правильно. LLM даже не смущает, что документа, на который она ссылается, не существует и никогда не существовало. Если вы зададите вопрос по налогообложению продажи деривативов, сетка легко изобретет какое-нибудь ПБУ 1159/841 «Бухгалтерский учет речных камушков».
  2. LLM минимизируют энергозатраты и стараются максимально использовать для генерации ответа внутренние данные. Даже если включена функция поиска в интернете. А внутри у них, грубо говоря, интернет двухлетней давности.
  3. LLM обучена на огромном массиве данных обо всем на свете. Процитирую профессора Австралийского национального университета Т. Каэтано: «Чрезвычайно сложно ограничить LLM, чтобы он работал только в рамках соответствия определенной цели. Вам нужно использовать правильные ограждения, чтобы убедиться, что он не выходит за рамки, для которых он был разработан». То есть для конкретных задач нейросетку нужно дообучать. 

Как это сделать самостоятельно? Например, на базе ChatGPT можно пилить GPTs — собственные AI-ассистенты. Для этого пишется системный промпт — набор инструкций, которому LLM будет следовать при работе с пользователем. Туда же загружается база знаний с текстами, к которым он будет обращаться для ответа на запросы. Вот пример AI-консультанта бухгалтера. До живого консультанта ему пока расти и расти.

Объем информации, к которой ассистент будет обращаться, ограничен. Сейчас лимит составляет 128 тысяч токенов (это примерно 300 тысяч символов). И даже этот объем сетка экономит. Я пытался сделать ассистента, который отвечает с упором на мою «Бухгалтерию для небухгалтеров» — он не видел половину книги. И даже к тому тексту, который загрузился, ассистент не обращался, предпочитая искать в других источниках. При этом у него в промпте был четкий запрет на поиск где-то еще.

Частично эту проблему решает создание ассистентов при помощи отдельных продуктов (Assistants API и Vector Store). Там уже без навыков программирования будет сложно, но при наличии техспецов задача обучения выполнима.

Интеграция нейросетей в бухгалтерию: API и RPA для автоматизации

Обычный пользователь работает с LLM при помощи графического пользовательского интерфейса (Graphical User Interface, GUI). В большинстве современных LLM он реализован в виде чата, в котором можно написать промпт и прикрепить файлы для анализа. Но использование такого интерфейса отнимает много времени и подходит не для всякой задачи. Особенно если речь идет о повторяющихся рутинных операциях.

Например, бухгалтеру в аутсорсинге нужно категоризировать затраты по сотням входящих документов от поставщиков разных клиентов. Это задача, которую нейросети успешно решают с середины 2010-х годов. Если каждый акт или накладную бухгалтер будет отдельно носить в чат, а потом проводить документ в учетной системе на основе полученного ответа, вместо экономии времени получится перерасход. Кроме того, GUI сильно ограничен по количеству токенов, поэтому большой объем задач с его использованием не решить.

Для непосредственного обмена данными без участия пользователя современные приложения используют интерфейс программирования приложений (Application Programming Interface, API). Можно настроить API так, чтобы учетная система отгружала в LLM исходные данные (первичные документы), а LLM возвращала ответ чата по заданному промпту (категорию затрат). При соответствующей настройке учетной системы полученная информация может запускать процесс создания соответствующей бухгалтерской записи — это уже классическая автоматизация. Бухгалтер в такой конфигурации нужен только для контроля.

Интеграция по API также делает доступным большее количество настроек LLM. А это влияет на точность ответов. Например, так называемая температура позволяет делать их более или менее детерминированными. Увеличение температуры даст большую случайность ответов, уменьшение — меньшую. Для нашего примера с категоризацией затрат высокая температура не нужна, а для написания стихов — очень полезна.

На практике бывает, что учетная система не имеет API. Или вокруг нее развернута куча другого софта, которым пользуется бухгалтер: системы ЭДО, складского учета, банк-клиенты. Оттуда берутся какие-то данные и вручную переносятся в учетную систему, потому что API нет уже у этих сервисов. Как подружить LLM с такой инфраструктурой?

На помощь приходит старая добрая роботизация (Robotic Process Automation, RPA). Робот взаимодействует с GUI: берет данные в одной системе и вводит в другую. Например, загружает входящий документ из системы ЭДО и прикрепляет его в чат LLM с предустановленным промптом. После этого копирует ответ LLM, открывает нужный документ в учетной системе, вставляет скопированный текст в нужное поле и запускает процесс проведения документа. То есть повторяет действия живого бухгалтера.

Стыковка систем по API и RPA могут сочетаться. Например, робот собирает данные в софте без API и передает его в LLM через API с заданными тонкими настройками. Ответ LLM поступает в учетную систему по API и запускает в ней процесс создания бухгалтерской записи. Это позволит получать максимально качественный результат в системе из взаимодействующего софта разных поколений и сложности. Там, где обычно единственным связующим звеном был человек.

Задачи бухгалтера, которые можно доверить нейросетям

Естественно, закинуть промпт в  ChatGPT или DeepSeek и получить адекватный результат не получится. Для успешной работы потребуется обучить модель и интегрировать ее в учетную систему.

Пока вижу, что  LLM смогут помогать бухгалтеру решать следующие задачи:

  1. Выявление мошенничества и ошибок в бухгалтерском учете и финансовой отчетности. LLM способны анализировать большие объемы данных и находить закономерности. При этом данные могут извлекаться не только из учетной системы. Например, LLM способны сравнить объем поставки с отчетностью поставщика и понять, что он не мог отгрузить такую большую партию. Нехарактерные транзакции или показатели будут подсвечены, после чего можно исследовать причины аномальных значений. 
  2. На этой же способности нейросетей основаны смежные с учетом действия: финансовое прогнозирование (в том числе для проверки выполнения допущения непрерывности деятельности) и аудит. Здесь LLM может работать в связке с машинным обучением (ML) регрессионной модели, обогащая базу примерами. Компании Big4 уже вовсю разрабатывают таких AI-ассистентов.
  3. Категоризация затрат на основе документов поставщика (акты, накладные, счета-фактуры). Это сценарий, отработанный еще до хайпа нейросетей начала 2020-х. Например, сочетании с OCR такую задачу еще в 2017 году решала компания «Кнопка», а чуть позже — «Моё дело». С распространением электронного документооборота задача упрощается — OCR прикручивать не потребуется.
  4. Проверка учетной политики на соответствие бухгалтерским стандартам и даже ее составление с учетом информации о специфике деятельности компании. Для этого LLM нужно обучить бухгалтерской нормативке и скормить ей базу учетных политик компаний разного размера из разных отраслей с пояснением почему в каждом случае вынесено именно такое профессиональное суждение
  5. Автоматическая генерация пояснений к финансовой отчетности. Имея доступ к финансовой отчетности и другой информации о бизнесе организации, можно сгенерировать пояснения по заданным шаблонам или в произвольной форме.
  6. Разработка тестов для аттестации сотрудников бухгалтерии и соискателей. С этой задачей LLM уже отлично справляется без дополнительного обучения. Алгоритм прост: записываете видеолекцию, транскрибируете ее в текст и «скармливаете» модели. 
  7. Подготовка ответов на требования налоговой. Нужно объяснить LLM из каких баз знаний брать информацию (налоговое законодательство, интересующие транзакции, результаты арбитража) и задать ограничения (например, минимизировать риск уголовного преследования).
  8. Подтверждение оценки активов. Например, при тестировании любых активов на обесценение. LLM исследует рынок аналогичных активов с заданными параметрами и подготовит обоснование справедливой стоимости. Но если активный рынок отсутствует и нужно определять ценность использования, LLM — не лучший помощник.

Важно помнить, что LLM — это не универсальные мозги, а специализированный инструмент, который подходит не для любой задачи. Забивать саморезы молотком или писать стихи при помощи калькулятора — так себе идеи. LLM хороши при работе с текстами. А, например, считают они посредственно. Да и в обозначенных задачах безоговорочно доверять LLM нельзя. Если провести аналогию с редакцией, LLM — талантливый копирайтер. Но как человек, который не один год руководил редакциями, могу точно сказать: косячат все, и даже лучшим копирайтерам необходим редактор. Им бухгалтер и станет.

Коротко о нейросетях в бухгалтерии

LLM, такие как ChatGPT, Gemini и YandexGPT, основаны на нейронных сетях, обученных на огромных текстовых данных. Они способны понимать, анализировать и генерировать текст. 

У LLM есть ряд ограничений: они не разбираются в законодательстве, могут ссылаться на несуществующие документы и имеют устаревшие внутренние данные. Для специализированных задач их необходимо дообучать, создавая собственных AI-ассистентов с загруженной базой знаний. При этом LLM не всегда используют загруженные данные, предпочитая искать в других источниках.

Использование LLM через чат-интерфейс неэффективно для рутинных задач. Для автоматизации используют API для прямого обмена данными с учетной системой. Если API нет, можно применять роботизацию (RPA), которая имитирует действия человека. Эти подходы можно сочетать для достижения лучшего результата.

После обучения и интеграции LLM могут помогать в решении ряда задач:

  1. Выявление мошенничества и ошибок.
  2. Категоризация затрат на основе документов.
  3. Проверка учетной политики и ее составление.
  4. Генерация пояснений к финансовой отчетности.
  5. Разработка тестов для сотрудников.
  6. Подготовка ответов на требования налоговой.
  7. Подтверждение оценки активов.

Однако LLM — это не универсальный инструмент. Они плохо считают и им нельзя полностью доверять. Бухгалтер должен выступать в роли редактора, проверяющего их работу.