NON-public license

LOW-CODE ПЛАТФОРМА SMILE

Modeling of complex systems
Национальный центр когнитивных разработок
ЛАБОРАТОРИЯ: Интеллектуальные технологии принятия решений
Для доступа к платформе обратитесь к
svivanov@niuitmo.ru

Иванов Сергей, руководитель лаборатории
svivanov@niuitmo.ru

SMILE (Simple Machine Learning Editor) — облачная платформа для автоматизации построения моделей технологических ибизнес-процессов наоснове сетевых структур иданных измерений.

SMILE предоставляет разработчику инструменты моделирования технологических процессов и управленческих решений в условиях неопределенности и неполноты данных. Она реализует логику для создания цифровых двойников различных организационно-технических систем и может служить основой для разработки средств поддержки принятия решения для топ-менеджмента высокотехнологичных производств.

Преимущества SMILE

  • Ключевое отличие платформы от подобных платформ на рынке — единое пространство для моделей различного типа: манипуляции данными, классической статистики и предметных моделей до машинного обучения (регрессии, классификации, кластеризации и пр.).
  • Результаты моделирования можно гибко перебрасывать между проектами (в реализации).
  • Результатом для пользователя может быть не только конечная модель в pipeline, но и любая промежуточная модель.
  • При разработке модели сделан упор на оптимизацию гиперпараметров для сложных задач машинного обучения.
  • На базе платформы возможно выполнение НИОКР.

Преимущества SMILE

Ключевые возможности платформы для управления моделями

В обновленную версию платформы были добавлены следующие пользовательские функции:

  • Авторизация через Google. При этом если пользователь не был ранее авторизован в системе, для него автоматически создается личный кабинет
  • Предоставление прав на просмотр и редактирование проектов другим пользователям (sharing). Эта возможность позволяет поделиться созданным проектом с сообществом пользователей в целом или с конкретным пользователем.
  • К проектам добавлены теги и реализован фильтр по ним для быстрого доступа к интересующим пользователя проектам.
  • Выполнена языковая локализация. В верхнем правом меню можно выбрать русский или английский язык.
  • Сделана подсветка узлов, которые были запущены. Это позволяет пользователю понять были ли узлы успешно запущены хотя бы один раз.
  • Ребра, которые используются вместо узлов с данными, подсвечиваются особым образом, чтобы их можно было отличить от узлов-связей (без данных). В целом механизм ребер-данных позволяет сократить число блоков в вычислительном графе и сделать граф более компактным и читаемым.
  • Добавлена возможность копирования проекта другого пользователя для дальнейшего редактирования и использования.
  • Реализована группировка по принципу модульности. Это обеспечивает эффективное переиспользование ранее созданных модулей.
  • Добавлено запоминание позиций узлов вычислительного графа в базе данных. Это позволяет сохранить внешний вид графа между запусками.
  • Добавлена кнопка "Запустить граф", которая запускает все узлы на исполнение. Пользователь сразу видит, корректно ли отработали все узлы графа.
  • Добавлена кнопка для автоматической раскладки узлов графа, которая либо фиксирует положение узлов графа, либо запускает функцию, которая сама находит оптимальное положение для них.
  • Важной новой функцией является обработка списка датафреймов в одном графе. Это позволяет обрабатывать сразу несколько массивов данных с общим списком полей, сравнивать массивы данных между собой и получать интервальные оценки в случае автоматическом генерации датафреймов. Данный подход также имитирует внутренний цикл обработки нескольких массивов данных в рамках единой процедуры обработки.
  • Изменения свойств узлов и ребер было переделано на сокеты. Это позволяет реализовать возможность оперативного изменения графа и его свойств сразу у всех пользователей, у которых открыт граф.
  • При чтении excel файла с набором страницы, разные страницы преобразуются в разные массивы данных. В ходе работы пользователь может выбрать любой из них.
скрыть

В плане реализации новых математических методов машинного обучения в платформе были реализованы:

  • Метод уменьшения размерности tsne (считается более продвинутым методом, чем метод главных компонент).
  • Добавлены графики интервальных оценок boxplot, диаграмма размаха («ящик с усами») и гистограмм (см. рисунок 3в).
  • Добавлена модель полносвязной нейронной сети (многослойный персептрон) для задач классификации и регрессии.
  • Реализовано «проряжение» набора данных при отрисовке графиков, если данных очень много. Это позволяет получить графики с данными без существенных задержек в случае больших данных, которые необходимо визуализировать.
  • Реализован метод bootstraping для интервального оценивания любых статистических параметров, включая точность оценивания моделей.
  • Метод cross_val_score (оценка точности моделей с использование кросс-валидации) был добавлен для нескольких моделей, что позволяет сформировать компактный граф с оценкой качества сразу нескольких моделей для последующего выбора наилучшей из них.
  • Добавлена возможность оценки точности моделей для обучающего массива данных (не только для тестового).
скрыть