Техническое задание для IT-команды (озеро данных)
Для расчёта ROI по каждому выпускнику нужно связать 4 государственных источника через ИИН. Связка данных — один раз. Обновление — ежеквартально.
Источник 1: МОН РК / Национальный центр тестирования
Таблица: Реестр выпускников · Ключ связи: ИИН выпускника
ИИН — уникальный идентификатор
Уровень образования (ТиПО / бакалавр / магистр)
Специальность / код по классификатору
Год выпуска
Наименование учебного заведения
Регион учебного заведения
Стоимость обучения (тыс. тг/год)
Общая сумма бюджетных расходов на студента
Балл ЕНТ / итоговой аттестации
Грант / платное (признак)
Источник 2: Министерство труда и соцзащиты РК (МТСЗН)
Таблица: Реестр занятости (ОСМС/ЕНСС) · Ключ связи: ИИН сотрудника
ИИН — связь с реестром выпускников
Статус занятости (работает / безработный / ИП)
Дата первого трудоустройства после выпуска
Код ОКЭД работодателя (отрасль)
Наименование работодателя
Регион места работы
Признак соответствия специальности
Источник 3: Комитет государственных доходов (КГД)
Таблица: Налоговые отчисления физлиц · Ключ связи: ИИН налогоплательщика
ИИН — связь
Год / квартал
Сумма начисленного ИПН (тг)
Сумма дохода (зарплата до вычетов, тг/мес)
Источник дохода (найм / предпринимательство)
Код ОКЭД работодателя
Регион регистрации работодателя
Источник 4: ГЦВП (Государственный центр по выплате пенсий)
Таблица: Пенсионные накопления · Ключ связи: ИИН вкладчика
ИИН — связь
Сумма отчислений ЕНПФ (тг/год)
Год
Наименование работодателя
Накопленная сумма на счёте (тг)
Схема интеграции (для архитектора данных)
МОН (выпускники) ──── ИИН ────▶ МТСЗН (занятость)
│
└─── ИИН ────▶ КГД (налоги + зарплата)
│
└─── ИИН ────▶ ГЦВП (пенсии)
Аналитическая витрина: ROI_выпускник = f(ИИН, год_выпуска)
Все 4 источника уже существуют и имеют ИИН как ключ. Задача IT: настроить cross-agency API или ETL-пайплайн в озеро данных с ежеквартальным обновлением. Никаких новых данных собирать не нужно — всё уже есть.
Почему нельзя соврать
Зарплата и налоги фиксируются КГД и ГЦВП независимо от МОН. Если выпускник «трудоустроен» по данным МОН, но не платит ИПН по данным КГД — система автоматически ставит флаг несоответствия. Это встроенный механизм верификации без ручного контроля.