ДОСТУП К ДАННЫМ
Для получения доступа необходимо отправить заявку в следующей форме:
1
Инструмент, доступ к которому вы хотите получить
2
Описание исследования, в котором планируете использовать выбранный инструмент
3
Описание целей, которых хотите достичь с помощью выбранного инструмента
PolyAnalyst
PolyAnalyst (PA) - аналитическая платформа для анализа данных, разработанная компанией Megaputer Intelligence. PA обеспечивает возможности для интеллектуального анализа данных: обработка естественного языка, машинное обучение, прогнозная аналитика. Обладает эффективными средствами лингвистического и семантического анализа,большим спектром инструментов для визуализации, возможностью построения интерактивных веб отчетов.

Формирование аналитического решения осуществляется путем соединения между собой готовых наборов команд - узлов и их настройки. За счет такого графического интерфейса PA не требует для работы навыков программирования. На базе Центра прикладного анализа больших данных ТГУ открыт ЦКП PolyAnalyst для представителей вузов-участников Консорциума исследователей больших данных.

Курс по платформе PolyAnalyst

Инструкция по установке

SN Lab
Доступ к данным осуществляется при помощи платформы по сбору и анализу данных (https://lk.opendata.university/) таких популярных социальных сетей, как: Вконтакте, Одноклассники, Фейсбук, Твиттер, Инстаграм и других. Эти данные можно использовать в исследовательских и прикладных проектах, образовательных программах, а также при написании научных статей.

Основная цель платформы – упрощение и автоматизация процесса сбора и обработки данных социальных сетей. Платформа позволяет выгружать в реальном времени следующие типы данных:

  • Поля из профиля пользователя (пол, дата рождения, возраст, география, интересы и т.д.)
  • Список друзей
  • Подписки на паблики и группы
  • Посты, лайки, комментарии со стены
  • Социальный граф пользователя
  • Список подписчиков сообществ
  • И многое другое…
Результаты выгрузки можно сохранить в удобные для дальнейшей обработки форматы: CSV файлы и Excel таблицы.

Начните работу с платформой с просмотра обучающего видео, которое познакомит с принципами работы и основным функционалом платформы на примере решения нескольких простых задач.

Kribrum
Kribrum - система мониторинга и анализа данных социальных медиа. Система собирает упоминания объекта (компания, персона, продукт компании и т. д.) из русскоязычных ресурсов Интернета: социальных сетей, онлайн-СМИ, блогов, тематических и региональных форумов и других ресурсов. Создается поисковый объект, который с момента создания начинает собирать всю публикуемую информацию, удовлетворяющую данному объекту. После чего эту информацию можно получить в виде структурированной таблицы, с указанием источника, автора, текста поста, даты и т. д.

Инструкция Kribrum

Мы предлагаем участникам Консорциума набор инструментов, которые упрощают процесс сбора и анализа данных из разных источников, в том числе социальных сетей. Вы сможете сосредоточиться на своем исследовании, а техническую часть мы возьмем на себя
Данные со всех источников
Вы уже сейчас можете получать данные из ВКонтакте, Facebook, Twitter и Одноклассников
Удобный формат результатов
Результаты можно сохранить в excel таблицу или в csv файл
Простой интерфейс
Интуитивно понятный интерфейс позволит вам в несколько кликов выполнить задачу
Бесплатная тех.поддержка
Наши специалисты помогут с решением ваших проблем
С начала 2019-ого года с периодичность раз в месяц собираются данные по 90 миллионов активных пользователей социальных сетей. Базы данных и программная часть платформы размещены на серверах суперкомпьютера Томского государственного университета СКИФ Cyberia (http://cyberia.tsu.ru/). Возможны массовые выгрузки из наших баз по отдельному запросу.

Участники Консорциума совместно собирают и используют разнообразные дата-сеты. Список дата-сетов постоянно расширяется, каждый набор содержит реальные и регулярно обновляемые данные.

Поисковая выдача по благотворительности

Упоминания объектов, идентифицирующих благотворительную тематику, в русскоязычном сегменте Интернет: СМИ, блоги, социальные сети, форумы, блоги. Сообщения собираются непрерывно с апреля 2018 года, в каждом сообщении доступны текст, дата, описание платформы, где размещено сообщение, и информация об авторе сообщения.

Страницы выпускников вузов в интернет-энциклопедии Wikipedia

Данные представляют собой список идентифицированных выпускников 336 международных университетов в интернет-энциклопедии Wikipedia. Указаны ссылка на страницу выпускника на английском и национальном для университета языках, дата рождения выпускника и количество просмотров его страницы за 2016 год.

Социальные графы радикальных онлайн-сообществ

Данные по связям внутри идентифицированных в ходе исследования онлайн сообществ радикалов в социальной сети "Вконтакте". За связь принимается совместная дружба пользователей, вся информация представлена в формате graphml. Некоторые из идентифицированных сообществ закрыты по решению суда.


Тесты на выявление признаков одаренности у школьников

Данные по профдиагностике 3000 школьников Томской области по 18 субтестам с измерением 97 параметров. "Одаренность" представлена тестами на креативность, мотивацию и интеллект. Дополнительно представлены профили в социальной сети "Вконтакте", подписки и тексты для 1600 школьников, проходивших тестирование.

ПРИМЕРЫ
ДАТА - СЕТОВ