- Для чего необходима аналитика в госсекторе, в каких секторах она наиболее востребована?
А. С. - Круг решаемых задач в госсекторе очень широк. Здесь актуальны многие задачи, решаемые в коммерческом секторе, но, безусловно, со своей спецификой, и есть задачи, связанные именно с работой госорганов. Само по себе понятие “аналитика” слишком общее. Условно аналитические инструменты можно разделить на 2 большие области применения. Первая - это аналитика в виде аналитической отчетности, когда можно посмотреть, что происходит. Этим многие чиновники, безусловно, пользуются, но по факту это не аналитика, это отчетность. Во-вторых, есть углубленная аналитика, которая подразумевает понимание того, что - почему - как происходило в прошлом (моделирование) и на основе этого прогнозирование показателей и событий в будущем или рекомендации по решениям, которые стоит принять в настоящем. С точки зрения способов принятия решений углубленная аналитика, в свою очередь, подразделяется на 2 направления. Существует аналитика, которая встраивается в оперативные процессы и помогает принимать автоматизированные решения, и есть углубленная аналитика как средство поддержки принятия тактических и стратегических решений. Например, она помогает чиновникам понять, с какими факторами связан рост смертности, как оптимально распределить бюджет. То есть можно сказать, что существует три больших аналитических области: аналитическая отчетность, оперативная автоматизированная углубленная аналитика (“Прогнозная”) и углубленная аналитика, дающая информацию для принятия решений человеком (“Описательная”).
Первой областью пользуются почти все, многие в связи с этим построили хранилища данных и системы регламентной отчетности. Что касается второй области, здесь есть много разработок, много прототипов, но в целом уровень развития СНГ можно назвать зачаточным. Хотя очень многие сферы управления уже осознали потребность, в частности, в сфере безопасности или, к примеру, для контроля закупок, в вопросах, где применяется риск-ориентированный подход, когда стоят задачи выборочного контроля и аудита. Таможня - это яркий пример, где нужен риск-ориентированный подход, то есть для каждой таможенной декларации оцениваются риски - рассчитывается вероятность того, что она нарушает законодательство. В госсекторе большинство чиновников должны в той или иной степени заниматься выборочным контролем и аудитом в своей зоне ответственности. Поэтому эта область очень активно развивается. Третья область аналитики - довольно специфическая, и до нее чиновники должны еще дорасти. В качестве примера, где она сегодня активно применяется в СНГ, приведу Центральный банк России, например, для принятия решений по вопросам, связанным с финансовой стабильностью. Если говорить о культуре использования серьезных средств углубленной аналитики для поддержки принятия решений, на мой взгляд, Центробанк является сейчас эталоном среди госорганов. Но, к сожалению, пока госструктур, где бы такие средства активно применялись, немного.
Еще одна из важнейших задач, которая требует применения аналитики в госсекторе, - планирование ресурсов. Например, сколько будет учеников школ - аккуратно спрогнозировать на несколько лет вперед, понять спрос на учителей каждого профиля и оптимальным образом распределить места на кафедрах в педвузах. Или, например, спрогнозировать заболеваемость населения и оптимально запланировать ресурсы - закупить оптимальное количество лекарств, разобраться с техникой и так далее, оптимально распределить места на кафедрах в медицинских вузах. Практически любой процесс планирования связан с прогнозированием спроса на госуслуги и распределением ресурсов. Сами слова “прогнозирование” и “оптимальный” говорят о том, что это адекватно делается средствами углубленной аналитики. К сожалению, это для нас совсем молодой тренд, хотя нет никаких проблем в том, чтобы решать такие задачи эффективно. Например, пожарные Лондона и полиция западной Австралии на базе ПО SAS прогнозируют число ожидаемых инцидентов в каждом точечном районе и строят оптимальные маршруты, расписания патрулирования и профилактических мероприятий.
Есть большой пласт задач в области прогнозирования инцидентов - например, аварий на важных технических узлах на основе показателей с датчиков оборудования. Сейчас есть ситуационные центры, и реагирование идет по факту, но аналитика могла бы сделать работу ситуационных центров проактивной.
Д. Ц. - В Казахстане сейчас формируется три ключевых области для применения аналитики.
Во-первых, это система поддержки принятия решений. Сейчас на всех уровнях власти создаются ситуационные (информационно-аналитические) центры для мониторинга и своевременного реагирования на критические инциденты. Ядром такого центра служит аналитическая система, которая с использованием углубленной аналитики помогает правильно оценить ситуацию и принять правильное решение. Такие системы осуществляют мониторинг всех важных показателей жизнеобеспечения региона, социальную сферу, медицинскую, общественный правопорядок.
Во-вторых, риск-ориентированный подход - госструктуры пытаются использовать превентивные меры, то есть не устранять последствия, а предотвратить негативные события.
Третья сфера - клиентоориентированный подход, то есть удовлетворение спроса населения на государственные слуги. Сильный интерес государственные органы проявляют к системам, которые помогают решать задачи повышения прозрачности, производительности работы госучреждений. Также высокий интерес со стороны государственных органов видно в области работы большими объемами неструктурированной информации, обработки информации из социальных сетей и электронных СМИ. Аналитика помогает выявить проблемные точки и расставить приоритеты. Сюда относится мониторинг жалоб и предложений, оптимальное управление, распределение ресурсов.
В Казахстане сейчас приходит понимание, что это необходимо, есть несколько проектов, но они находятся в стадии разработки, поэтому назвать их я пока не могу. Могу только сказать, что казахстанские государственные структуры стоят на пороге массового использования аналитики, в которой они так нуждаются. Если первопроходцами по использованию бизнес-аналитики были финансовые институты и телекоммуникационные компании, то сейчас на уровне государственных ведомств все чаще возникает потребность в полноценных аналитических платформах и работе по построению аналитических моделей высокой точности.
- Каким образом проходят процедуры отбора консультантов?
А. С. - Современный тренд заключается в том, чтобы не использовать консультантов, а иметь собственные аналитические платформы поддержки принятия решений. Причем это касается и анализа с целью принятия тактических и стратегических решений, и настройки системы принятия оперативных решений. Сейчас с этим нет никаких проблем: на рынке есть простые в использовании инструменты, которые позволяют, к примеру, проанализировать закупки, найти сомнительные отдельные случаи или область наиболее невыгодных закупок и на основе этого, например, принять решение, с кем стоит перезаключить договор или какой регион депремировать. На базе выявленных случаев можно быстро настроить систему, которая будет оперативно проверять каждую потенциальную закупку. Она автоматически рассчитает ожидаемый диапазон цен и другие параметры, и тот, кто отвечает за закупки, будет видеть перед собой полную картину в каждом случае.
Д. Ц. - Министерства и другие организации, во-первых, смотрят на уровень компании - для них важно, чтобы это был известный бренд с опытом работы в других странах - на европейский опыт, на практику работы в Южной Корее, Сингапуре. Второе - это присутствие компании на местном рынке и наличие локальных экспертов. Третий аспект касается компетенции - необходимо, чтобы она соответствовала ожиданиям заказчика. То есть компания должна иметь опыт, локальное представительство, должна обеспечить локальный уровень компетенции. У SAS есть своя специфика - мы занимаемся углубленной аналитикой, мы отбираем консультантов, нам нужны IT-специалисты, но со знанием математики. Сейчас на рынке есть математики и есть IT-специалисты. И достаточно сложно было найти именно таких консультантов, которые одновременно были бы и экспертами в IT-сфере, и математиками. Сейчас у нас есть государственная программа в трех вузах в Казахстане, где мы готовим таких специалистов - они уже знают аналитику как математики, а также умеют работать с IT-инструментами, могут строить аналитические модели в специальном программном обеспечении. Важны не только продукты, но и специалисты, которые будут с ними работать. Поэтому мы с этого года проводим несколько раз в год аналитический клуб в Астане. Мы организуем встречи аналитиков, где мы обсуждаем конкретные реализации аналитических задач, где люди могут просто обменяться опытом либо поделиться какой-то задачей, показать, как она реализуется c помощью аналитических инструментов.
- Насколько велик интерес госструктур к аналитике в связи с процессом внедрения новых регуляторных стандартов Базель-3?
А. С. - Базель-3 с госсектором напрямую не связан - только с Центробанком, вряд ли каким-то другим структурам он будет интересен.
Д. Ц. - Базель-3 - это стандарт для банков второго уровня, требования к капиталу, ликвидности - нормативный стандарт. В госсекторе он не применяется, соответственно, на интерес к аналитике со стороны госструктур не влияет.
- Считается, что консалтинг госструктур - это прежде всего рынок “большой четверки” аудиторских компаний и ограниченного количества глобальных игроков. Насколько тяжело конкурировать в такой компании?
А. С. - Как я уже говорил, сегодня тренд заключается в том, чтобы не доверять анализ внешним командам, которые слабо понимают, что происходит в твоем бизнесе, в твоем ведомстве. Нужно самим строить аналитические платформы и самостоятельно принимать решения. Поэтому тем, кто может предложить качественное программное обеспечение и обучение, конкурировать легко. Это понимание уже есть и в госструктурах - лучше построить платформу, которой будешь владеть ты сам, закладывать в нее свои методики, чем пользоваться внешним консалтингом.
Д. Ц. - Действительно, это рынок “большой четверки”, но есть еще ряд компаний, которые занимаются именно консалтингом, и они занимаются именно бизнес-консалтингом - тем, чтобы правильно построить бизнес-процессы. Что касается госсектора, то в силу секретности многих данных, в силу ведомственной специфики, требующей наличия собственных специалистов, складывается тенденция к самостоятельному созданию аналитических решений с помощью поставщика ПО. Консалтинг может быть привлечен для отдельных работ. Мы поставляем IT-решения, и у нас есть собственный IT-консалтинг, который помогает правильно внедрить наш софт и провести обучение специалистов заказчика. Но дальше наши клиенты в госсекторе работают с решениями с высокой долей самостоятельности, приглашая нас, например, для настройки нового функционала или в иных исключительных случаях.
- Большие данные в госсекторе. Как происходит их сбор и структурирование?
А. С. - Прежде всего, стоит уточнить, что есть разные типы больших данных, и, соответственно, работа с ними будет вестись по-разному. Во-первых, есть данные, которые мы получаем в результате мониторинга Интернета. Для работы с ними есть специальные системы класса web-crawling, которые закачивают информацию по ключевым словам или с нужных сайтов. Интернет - самый популярный источник. Важны отзывы граждан. Также есть поведение людей в Интернете, например, можно увидеть, что главный бухгалтер какой-нибудь компании искал в Интернете лазейки в законе, и это сильно повышает вероятность того, что в его организации есть нарушения, скажем, налогового законодательства. Есть специальные поставщики, которые этим занимаются. Во-вторых, есть обмен большими потоками данных между госкомпаниями. В-третьих, объем и разнообразие форматов собственных данных может потребовать от ведомства использования специализированных технологий. Например, если мы собираем жалобы и обращения граждан.
Когда мы получаем текст из Интернета или другого внешнего или внутреннего источника, его необходимо структурировать - в первую очередь категоризировать - есть специальные системы контекстно-тематического анализа, которые делают это на основе средств машинного обучения с применением математики и на основе лингвистического понимания текста. Первый способ структурирования связан с тем, что весь этот текст мы, по сути, интерпретируем, то есть мы определяем его тематику. Посмотрели слова - это про политику, это про спорт, это про работу ЖКХ. Но бывает структурирование неинтерпретируемое. Мы говорили, что есть автоматическое оперативное использование аналитики, когда, например, в случае с таможенной декларацией, рассчитывается вероятность того, что она нарушает законодательство. Считайте, что система могла бы залезть в соцсети, посмотреть, какой лексикой общается, например, в соцсетях тот, кто подает декларацию, и этот набор текста использовать как дополнительные факторы, дополнительные предикторы при расчете этой вероятности. Их не нужно категоризировать, потому что неважно, что конкретно человек писал - важно, чтобы система использовала слова и словосочетания для корректировки вероятности. Если лексика человека похожа на язык криминальных структур, то система даст сигнал, что нужно принять меры для снижения риска этой таможенной декларации.
Еще можно структурировать взаимосвязи - то, как люди и другие объекты связаны между собой. Возьмем еще один пример из области таможни. Есть декларация, в ней указаны конкретные объекты - декларант, транспортное средство. Если в наличии есть граф, который помнит, с какими другими декларантами связано, например, это самое транспортное средство, то он может сообщить о его “темном прошлом”, если им пользовались те, кто нарушал законодательство. Можно математически определять - вплоть до лидеров организованных криминальных группировок. Через анализ взаимосвязей можно существенно скорректировать вероятность того, что данная конкретная декларация, про которую еще ничего не известно, нарушает законодательство.
Еще один пример использования анализа взаимосвязей и неструктурированной информации вместе - выявление информационных волн: он позволяет узнать, как распространяются новые идеи, мысли по Интернету, какие мысли распространяются намеренно, какие - ненамеренно. Информационная война - существенная область в работе государства, в том числе в вопросах, связанных с безопасностью.
Д. Ц. - Сейчас готовится большое количество проектов, связанных с большими данными, но все они находятся на начальном этапе. Много лет госкомпании создавали свои информационные системы, накопили большой объем данных, на основе которых можно делать проекты по большим данным. Кроме того, госструктуры сейчас много внимания уделяют проекту “открытые данные”, в этом случае госсектор сам предоставляет открытые данные - то есть открывает данные, которые не несут государственных секретов и персональной информации. В этом смысле государственные организации сами идут навстречу бизнесу и друг другу в раскрытии информации. Данные уже предоставляются в структурированном машиночитаемом виде, и со временем таких открытых данных будет все больше. Этот процесс долгий, поскольку данных много, и они, как правило, не структурированы - нужно подключать множество разных источников, множество разнородных систем. Есть и такие данные, которые не подлежат структурированию - например, данные из Интернета, из соцсетей.