Доступ к данным и инструментам

PolyAnalyst

Платформа подходит для обработки естественного языка, лингвистического и семантического анализа, машинного обучения, прогнозной аналитики. Результаты анализа можно визуализировать и сформировать интерактивные веб-отчеты.

Доступ на 3 месяца

Выгрузка данных

Выгрузки данных из соцсетей, агрегаторов вакансий, баз цитирований. Данные выгружаются в форматах CSV и Excel.


Доступ по запросу

Jupyterhub

Для анализа данных и машинного обучения на базе Jupyter Notebook для языков программирования Python и R.

Доступ на 3 месяца
Мы предлагаем участникам Консорциума набор инструментов, которые упрощают процесс сбора и анализа данных для исследований

Тесты на выявление признаков одаренности у школьников

Данные по профдиагностике 3000 школьников Томской области по 18 субтестам с измерением 97 параметров. «Одаренность» представлена тестами на креативность, мотивацию и интеллект. Дополнительно представлены профили в социальной сети «Вконтакте», подписки и тексты для 1600 школьников, проходивших тестирование.

Социальные графы радикальных онлайн-сообществ

Данные по связям внутри идентифицированных в ходе исследования онлайн-сообществ радикалов в социальной сети «Вконтакте». За связь принимается совместная дружба пользователей, вся информация представлена в формате graphml. Некоторые из идентифицированных сообществ закрыты по решению суда.

Страницы выпускников вузов в Wikipedia

Cписок идентифицированных выпускников 336 международных университетов в интернет-энциклопедии Wikipedia. Указаны ссылка на страницу выпускника на английском и национальном для университета языках, дата рождения выпускника и количество просмотров его страницы за 2016 год.

Поисковая выдача по благотворительности

Упоминания объектов, идентифицирующих благотворительную тематику, в русскоязычном сегменте Интернет: СМИ, блоги, социальные сети, форумы, блоги. Сообщения собираются непрерывно с апреля 2018 года, в каждом сообщении доступны текст, дата, описание платформы, где размещено сообщение, и информация об авторе сообщения.
С начала 2019-ого года с периодичностью раз в месяц собираются данные по 90 млн активных пользователей социальных сетей. Базы данных размещены на серверах суперкомпьютера Томского государственного университета СКИФ Cyberia. Возможны массовые выгрузки из наших баз по отдельному запросу.

Примеры дата-сетов

Напишите нам. Укажите инструмент, доступ к которому вы хотите получить, опишите исследования, в котором планируете использовать выбранный инструмент или дата-сет, и целей, которых хотите достичь

Получить доступ

Евгений
Петров

petrov@data.tsu.ru
Телеграм

Условия

При публикации результатов, полученных с помощью платформы PolyAnalyst, два необходимых условия

В связи с ограниченным числом лицензий

Доступ предоставляется на 3 месяца, после чего при отсутствии результатов аккаунт деактивируется

Крупные проекты обсуждаются индивидуально

Если по истечении одной недели после предоставления доступа в систему не выполнен вход, аккаунт деактивируется

Приоритетность повторной выдачи доступа снижается

Заявка на доступ

Заполните форму, мы свяжемся с вами