Files
gotohack/README.md
2016-02-24 19:35:00 +03:00

1.2 KiB
Raw Blame History

Пацанский анализ

Презентация тут

Сделано на хакатоне GoTo Hack 2016

p.s. Если кому-то нужен исходный датасет, то можете писать любому из контрибьютеров.

Кратко

Проект посвящен анализу особого социального слоя - пацанов.

Пацанов мы определили, как участников специфических групп в ВК - "пацанских цитатников". За более подробным описанием стоит обратиться к презентации. Почти все результаты там есть.

Технологии

В какой-то степени были использованы следующие штуки:

  1. nltk
  2. vk-api для Python
  3. MongoDB и PyMongo
  4. Matplotlib
  5. Геокодер Яндекса
  6. Syncthing (для синхронизации больших бинарных файлов)