LOW-CODE ПЛАТФОРМА SMILE
Перейти к платформе
SMILE (Simple Machine Learning Editor) — облачная платформа для автоматизации построения моделей технологических ибизнес-процессов наоснове сетевых структур иданных измерений.
SMILE предоставляет разработчику инструменты моделирования технологических процессов и управленческих решений в условиях неопределенности и неполноты данных. Она реализует логику для создания цифровых двойников различных организационно-технических систем и может служить основой для разработки средств поддержки принятия решения для топ-менеджмента высокотехнологичных производств.
Преимущества SMILE
- Ключевое отличие платформы от подобных платформ на рынке — единое пространство для моделей различного типа: манипуляции данными, классической статистики и предметных моделей до машинного обучения (регрессии, классификации, кластеризации и пр.).
- Результаты моделирования можно гибко перебрасывать между проектами (в реализации).
- Результатом для пользователя может быть не только конечная модель в pipeline, но и любая промежуточная модель.
- При разработке модели сделан упор на оптимизацию гиперпараметров для сложных задач машинного обучения.
- На базе платформы возможно выполнение НИОКР.
Преимущества SMILE
В обновленную версию платформы были добавлены следующие пользовательские функции:
- Авторизация через Google. При этом если пользователь не был ранее авторизован в системе, для него автоматически создается личный кабинет
- Предоставление прав на просмотр и редактирование проектов другим пользователям (sharing). Эта возможность позволяет поделиться созданным проектом с сообществом пользователей в целом или с конкретным пользователем.
- К проектам добавлены теги и реализован фильтр по ним для быстрого доступа к интересующим пользователя проектам.
- Выполнена языковая локализация. В верхнем правом меню можно выбрать русский или английский язык.
- Сделана подсветка узлов, которые были запущены. Это позволяет пользователю понять были ли узлы успешно запущены хотя бы один раз.
- Ребра, которые используются вместо узлов с данными, подсвечиваются особым образом, чтобы их можно было отличить от узлов-связей (без данных). В целом механизм ребер-данных позволяет сократить число блоков в вычислительном графе и сделать граф более компактным и читаемым.
- Добавлена возможность копирования проекта другого пользователя для дальнейшего редактирования и использования.
- Реализована группировка по принципу модульности. Это обеспечивает эффективное переиспользование ранее созданных модулей.
- Добавлено запоминание позиций узлов вычислительного графа в базе данных. Это позволяет сохранить внешний вид графа между запусками.
- Добавлена кнопка "Запустить граф", которая запускает все узлы на исполнение. Пользователь сразу видит, корректно ли отработали все узлы графа.
- Добавлена кнопка для автоматической раскладки узлов графа, которая либо фиксирует положение узлов графа, либо запускает функцию, которая сама находит оптимальное положение для них.
- Важной новой функцией является обработка списка датафреймов в одном графе. Это позволяет обрабатывать сразу несколько массивов данных с общим списком полей, сравнивать массивы данных между собой и получать интервальные оценки в случае автоматическом генерации датафреймов. Данный подход также имитирует внутренний цикл обработки нескольких массивов данных в рамках единой процедуры обработки.
- Изменения свойств узлов и ребер было переделано на сокеты. Это позволяет реализовать возможность оперативного изменения графа и его свойств сразу у всех пользователей, у которых открыт граф.
- При чтении excel файла с набором страницы, разные страницы преобразуются в разные массивы данных. В ходе работы пользователь может выбрать любой из них.
В плане реализации новых математических методов машинного обучения в платформе были реализованы:
- Метод уменьшения размерности tsne (считается более продвинутым методом, чем метод главных компонент).
- Добавлены графики интервальных оценок boxplot, диаграмма размаха («ящик с усами») и гистограмм (см. рисунок 3в).
- Добавлена модель полносвязной нейронной сети (многослойный персептрон) для задач классификации и регрессии.
- Реализовано «проряжение» набора данных при отрисовке графиков, если данных очень много. Это позволяет получить графики с данными без существенных задержек в случае больших данных, которые необходимо визуализировать.
- Реализован метод bootstraping для интервального оценивания любых статистических параметров, включая точность оценивания моделей.
- Метод cross_val_score (оценка точности моделей с использование кросс-валидации) был добавлен для нескольких моделей, что позволяет сформировать компактный граф с оценкой качества сразу нескольких моделей для последующего выбора наилучшей из них.
- Добавлена возможность оценки точности моделей для обучающего массива данных (не только для тестового).