ДОСТУП К ДАННЫМ
Для получения доступа необходимо отправить заявку в следующей форме:
1
Инструмент, доступ к которому вы хотите получить
2
Описание исследования, в котором планируете использовать выбранный инструмент
3
Описание целей, которых хотите достичь с помощью выбранного инструмента
Доступ предоставляется исключительно в исследовательских целях.
PolyAnalyst
PolyAnalyst (PA) - аналитическая платформа для анализа данных, разработанная компанией Megaputer Intelligence. PA обеспечивает возможности для интеллектуального анализа данных: обработка естественного языка, машинное обучение, прогнозная аналитика. Обладает эффективными средствами лингвистического и семантического анализа, большим спектром инструментов для визуализации, возможностью построения интерактивных веб отчетов.

Формирование аналитического решения осуществляется путем соединения между собой готовых наборов команд - узлов и их настройки. За счет такого графического интерфейса PA не требует для работы навыков программирования. На базе Центра прикладного анализа больших данных ТГУ открыт ЦКП PolyAnalyst для представителей вузов-участников Консорциума исследователей больших данных.

При публикации результатов, полученных с помощью платформы необходимым условием является ссылка на статью:
Петров Е.Ю., Саркисова А.Ю. Ресурс аналитической платформы PolyAnalyst в социогуманитарных научных исследованиях // Открытые данные - 2021. Материалы форума / Под ред. А.Ю. Саркисовой. Томск: Издательство Томского государственного университета, 2021. С. 94-104.

В связи с ограниченным числом лицензий:
---Доступ предоставляется на 3 месяца, после чего аккаунт деактивируется (крупные проекты обсуждаются индивидуально).
---Если по истечении одной недели после предоставления доступа в систему не выполнен вход, аккаунт деактивируется (приоритетность повторной выдачи доступа снижается).

Курс по платформе PolyAnalyst

Вход в систему: pa.data.tsu.ru

Jupyterhub
Jupyterhub - многопользовательская среда выполнения задач анализа данных и машинного обучения c на базе Jupyter Notebook для языков программирования Python и R. Среда развернута на базе суперкомпьютера Томского государственного университета СКИФ Cyberia.



Контактное лицо
Евгений Петров
petrov@data.tsu.ru
tg: @exmin
С начала 2019-ого года с периодичность раз в месяц собираются данные по 90 миллионов активных пользователей социальных сетей. Базы данных размещены на серверах суперкомпьютера Томского государственного университета СКИФ Cyberia (http://cyberia.tsu.ru/). Возможны массовые выгрузки из наших баз по отдельному запросу.


Поисковая выдача по благотворительности

Упоминания объектов, идентифицирующих благотворительную тематику, в русскоязычном сегменте Интернет: СМИ, блоги, социальные сети, форумы, блоги. Сообщения собираются непрерывно с апреля 2018 года, в каждом сообщении доступны текст, дата, описание платформы, где размещено сообщение, и информация об авторе сообщения.

Страницы выпускников вузов в интернет-энциклопедии Wikipedia

Данные представляют собой список идентифицированных выпускников 336 международных университетов в интернет-энциклопедии Wikipedia. Указаны ссылка на страницу выпускника на английском и национальном для университета языках, дата рождения выпускника и количество просмотров его страницы за 2016 год.

Социальные графы радикальных онлайн-сообществ

Данные по связям внутри идентифицированных в ходе исследования онлайн сообществ радикалов в социальной сети "Вконтакте". За связь принимается совместная дружба пользователей, вся информация представлена в формате graphml. Некоторые из идентифицированных сообществ закрыты по решению суда.


Тесты на выявление признаков одаренности у школьников

Данные по профдиагностике 3000 школьников Томской области по 18 субтестам с измерением 97 параметров. "Одаренность" представлена тестами на креативность, мотивацию и интеллект. Дополнительно представлены профили в социальной сети "Вконтакте", подписки и тексты для 1600 школьников, проходивших тестирование.

ПРИМЕРЫ
ДАТА - СЕТОВ