И снова о машинном обучении на платформе .NET

Продолжение доклада про потенциал и возможности машинного обучения на платформе .NET. — на этот раз с упором на яркие и выразительные демки, демонстрирующие возможности .NET и Machine Learning. Ну и, конечно, как быть без производительности и бенчмарков?

Первая демонстрация: анализ данных.
В качестве набора данных мы возьмем две базы твитов (общая, ни к чему не привязанная база на 1600000 твитов, размеченная с указанием тональности сообщения и база твитов об F#).
На примере этих баз я покажу: параллелизм, провайдеры типов, легкое построение графиков и много интересной статистики.

Вторая демонстрация: алгоритмы ML из Accord.
Я покажу, как проводить анализ тональности твита, покажу пару интересных алгоритмов, например, как можно проверить, относится ли тот или иной твит к разработке ПО.
Прямо на докладе мы попробуем на лету собирать твиты зрителей по хештегу #dotnext и показывать их тональность.
В качестве бонуса я покажу обновленные бенчмарки для выделения более интересной статистики.


Роман Неволин

WaveAccess

.NET разработчик в компании WaveAccess, любящий ковырять данные и искать в них хитрые закономерности. Активно занимаюсь исследованиями в области Machine Learning и разработкой собственных инструментов машинного обучения.