- Главная
- Новости
- Создание цифрового архива Казахстана: сможет ли страна защитить себя от утечки данных?
Создание цифрового архива Казахстана: сможет ли страна защитить себя от утечки данных?
Запуск национального цифрового архива наряду с преимуществами может иметь и риски.

Казахстан готовится к запуску Национального цифрового архива – платформы, которая объединит научные исследования, архивные документы, произведения искусства и другие ценные данные. Президент Касым-Жомарт Токаев на четвертом заседании Национального курултая подчеркнул, что этот ресурс будет доступен не только отечественным, но и зарубежным разработчикам нейросетей.
Это решение открывает возможности для развития искусственного интеллекта в стране, особенно в контексте работы с казахским языком. Однако возникает ряд вопросов: насколько свободным будет доступ к архиву? Как государство защитит свои цифровые активы? И, главное, сможет ли Казахстан не просто предоставлять данные, но и стать полноценным игроком на рынке ИИ-разработок? Об этом читайте в материале BaigeNews.kz.
ИИ в Казахстане: текущее состояние и барьеры
Сегодня многие журналисты и исследователи уже активно используют нейросети в своей работе, но сталкиваются с ограничениями, особенно в казахоязычных версиях платформ ИИ. Один из них – корреспондент столичного информационного портала Олжас Адай.
"Президент точно выразился по поводу нейросетей. Думаю, журналисты, которые активно используют ИИ, хорошо понимают эту тему. Я тоже использую ИИ уже около года. Сначала его казахский язык был не очень хорош, но сейчас он делает переводы намного лучше. В основном я использую его для перевода. Информации он дает не так много, как на английском или русском, но с каждым днем становится лучше", – говорит журналист.
Еще один проблемный аспект, с которым сталкивается Олжас при работе, – распознавание визуальных данных. Например, ИИ до сих пор слабо идентифицирует казахскую внешность при генерации изображений.
"Если попросить ИИ создать изображение для статьи, становится заметно, что он плохо распознает казахов. Он чаще выдает изображения других национальностей или просто похожие, универсальные картинки. В такие моменты это вызывает неудобство. Но, думаю, все впереди. Радует, что ИИ быстро совершенствуется", – делится журналист.
Создание Национального цифрового архива может частично решить эти проблемы, предоставив разработчикам доступ к обширному массиву данных.
Эту мысль поддерживает специалист по искусственному интеллекту Мейржан Ауелханулы. Он считает, что грамотно организованный доступ к архиву может дать Казахстану конкурентное преимущество.
"Открытие такого архива, с одной стороны, позволит представить культурное, историческое и научное наследие Казахстана на мировой арене. Разработчики нейросетей смогут использовать национальные данные для создания более точных и качественных продуктов, что поможет сократить количество искаженной или поверхностной информации о стране. Кроме того, это создаст новые возможности для отечественных стартапов и IT-компаний. Однако, если архив будет открыт бесконтрольно, могут возникнуть риски, связанные с нарушением авторских прав, незаконным использованием конфиденциальных или персональных данных, а также их коммерческой эксплуатацией без разрешения", – говорит он.
По словам Ауелханулы, необходимо четко прописать границы использования данных.
"Прежде всего, необходимо определить, какие материалы будут в открытом доступе, а какие – ограничены, и закрепить это в законодательстве. Требования, касающиеся авторских прав, должны быть четко прописаны, а при необходимости – оформлены индивидуальные соглашения с правообладателями. Часть архивных документов можно защитить с помощью водяных знаков, что позволит контролировать их незаконное использование. Кроме того, в договорах с разработчиками, использующими архив, должно быть четко прописано, что данные можно применять только в исследовательских или строго ограниченных коммерческих целях", – подчеркивает эксперт.
В долгосрочной перспективе цифровизация наследия может позволить стране создать собственные языковые модели, адаптированные под казахский язык и культурный контекст.
"Если удастся собрать значительный объем исторических, культурных и научных данных на казахском и других языках, эти данные можно будет использовать для обучения нейросетей и создания крупных языковых моделей (LLM), адаптированных к Казахстану. Это позволит разработать искусственный интеллект, глубже понимающий казахский язык и местную специфику, что принесет пользу, как государству, так и бизнесу", – считает Мейржан Ауелханулы.
По мнению заведующей кафедрой Института автоматики и информационных технологий КазНИТУ имени К. Сатпаева Фариды Абдолдиной, оцифровка архивных материалов необходима, прежде всего, для научных исследований.
"Такое решение на уровне главы государства было принято для того, чтобы сделать доступ к архивным данным проще как для граждан Казахстана, так и для зарубежных исследователей. Эти материалы могут быть полезны ученым, историкам и людям, интересующимся историей страны. Кроме того, их оцифровка продлит срок существования уникальных документов, которые со временем изнашиваются и могут быть утрачены", – отмечает Абдолдина.
Мировая практика показывает, что эффективное управление национальными архивами приносит пользу, как экономике, так и науке. В Европе существует проект Europeana, объединяющий цифровые записи тысяч музеев и библиотек в единую базу данных. В США Библиотека Конгресса предоставляет в открытом доступе обширную коллекцию цифровых исторических документов, но часть материалов становится доступной только после истечения срока действия авторских прав. В Японии цифровой архив Национальной парламентской библиотеки (National Diet Library) также содержит открытые и ограниченные материалы, доступ к которым предоставляется по специальному разрешению. В этих странах используются как законодательные, так и технические меры, чтобы одновременно сохранить ценность архивов и защитить их от неправомерного использования.
Помимо технологических преимуществ, проект может принести и экономический эффект. Во-первых, цифровые данные станут основой для инновационных проектов, что приведет к появлению новых рабочих мест и продуктов в IT-секторе. Во-вторых, виртуальные музеи и цифровые выставки могут привлечь как отечественных, так и иностранных туристов, способствуя развитию культурного туризма. В-третьих, повысится качество научных исследований, что откроет новые возможности в истории, археологии, филологии и других областях. В целом, это масштабный проект, который усилит конкурентоспособность страны и положительно повлияет на экономику.
Технологии для оцифровки и защиты данных
Для эффективного создания Национального цифрового архива необходимы современные технологии сканирования, обработки изображений и защиты информации. Фарида Абдолдина считает, что в этом процессе ключевую роль могут сыграть инструменты компьютерного зрения и алгоритмы обработки цифровых изображений.
"Современные технологии искусственного интеллекта, такие как компьютерное зрение, позволяют быстрее оцифровывать и анализировать архивные документы. Однако важно учитывать, что с этими данными необходимо обращаться осторожно. Они должны быть защищены, чтобы не попасть в открытый доступ без должного контроля", – говорит она.
Проблема безопасности информации особенно актуальна, если речь идет о государственных архивах. Должны быть предусмотрены строгие механизмы доступа и многоуровневые системы защиты.
"Если представить, что архив президента Казахстана станет доступен любому пользователю интернета, это может привести к непредсказуемым последствиям. Поэтому необходимо четко регламентировать, какие данные можно открывать, а какие - нет. Должны быть правовые нормы, регулирующие использование этих данных, и меры ответственности за их неправомерное применение", – поясняет Абдолдина.
По мнению управляющего директора DataStar и сопредседателя Комитета информационной безопасности Альянса QAZTECH Евгения Питолина, для успешной реализации проекта необходима надежная инфраструктура центров обработки данных с высокой отказоустойчивостью.
"Использование озёр данных позволит гибко структурировать информацию и применять продвинутые методы анализа, включая машинное обучение и искусственный интеллект. Такой подход обеспечит эффективное управление информацией и её доступность для различных категорий пользователей", – поясняет эксперт.
Национальный цифровой архив станет не просто хранилищем, а интеллектуальной платформой, позволяющей анализировать данные. Для этого потребуется участие дата-саентистов – специалистов по обработке данных, которые разработают алгоритмы категоризации, поиска и анализа информации с применением искусственного интеллекта.
"Цифровой архив должен быть защищён от потенциальных угроз: утечек, взломов и несанкционированного доступа. И это лишь малая часть всех проблем. Поэтому требуется внедрение принципов безопасной разработки на всех этапах создания системы. Кроме того, необходимо выстроить многоуровневую защиту данных и интерфейсов взаимодействия, чтобы контролировать, кто и как использует архивные материалы", – говорит Питолин.
По его словам, для защиты системы необходимо привлекать Red Team-команды – специалистов, имитирующих реальные кибератаки для выявления уязвимостей. Это позволит протестировать защиту архива и повысить его устойчивость к потенциальным угрозам. В Казахстане есть компетентные игроки в сфере кибербезопасности, которые могут принять участие в этом проекте.
Создание архива предполагает не только технические решения, но и повышение цифровой грамотности среди пользователей. Люди должны понимать, как безопасно работать с данными, как отличать достоверную информацию от фейков и как защитить себя в цифровом пространстве. Это особенно важно, учитывая растущее влияние киберугроз.
"Для успешной реализации проекта необходимо привлекать опытные IT-компании Казахстана, обладающие экспертизой в области кибербезопасности, облачных технологий и управления данными (…) Эти компании могут внести значительный вклад в создание архитектуры архива, обеспечение его защиты и разработку аналитических инструментов", – отметил Евгений Питолин.
Поставщик данных или лидер в разработке ИИ?
Вопрос о том, сможет ли Казахстан занять ведущие позиции на мировом рынке искусственного интеллекта, остается открытым. По мнению Фариды Абдолдиной, оцифровка данных даст стране конкурентное преимущество, но говорить о лидерстве пока рано.
"Скорее, Казахстан может стать поставщиком данных для ИИ-технологий. Если у нас будут систематизированные, оцифрованные архивы, это привлечет внимание международных компаний. Но для того чтобы выйти на новый уровень, нужно поддерживать отечественные IT-компании и стартапы", – считает эксперт.
В перспективе Национальный цифровой архив может стать мощным инструментом для развития искусственного интеллекта и цифровой экономики Казахстана. Однако успех этого проекта зависит от нескольких ключевых факторов.
Во-первых, нужны четкие правила доступа к данным – баланс между открытостью и защитой цифровых активов.
Во-вторых, необходимо все силы направить на кибербезопасность.
В-третьих, государственная стратегия – Казахстан должен не просто предоставлять данные, но и развивать собственные ИИ-решения.
Если эти аспекты будут учтены, архив станет не просто базой данных, а ключевым элементом цифрового будущего страны.
Самое читаемое
- Пересадка почек спасла жизни двух человек в Шымкенте
- Борец Болат Сакаев одолел соперника из Китая и вышел в финал ЧА в Иордании
- Землетрясение на территории Китая зарегистрировали казахстанские сейсмологи
- Взятки от директоров школ и миллионные хищения: новые уголовные дела завёл Антикор
- Казахстан обыграл Беларусь в отборе на Евро-2025 по футзалу