be5b2edc767d9ad780fb1c52e0a1d70eca0f779c
Пацанский анализ
Презентация тут
Сделано на хакатоне GoTo Hack 2016
p.s. Если кому-то нужен исходный датасет, то можете писать любому из контрибьютеров.
Кратко
Проект посвящен анализу особого социального слоя - пацанов.
Пацанов мы определили, как участников специфических групп в ВК - "пацанских цитатников". За более подробным описанием стоит обратиться к презентации. Почти все результаты там есть.
Технологии
В какой-то степени были использованы следующие штуки:
- nltk
- vk-api для Python
- MongoDB и PyMongo
- Matplotlib
- Геокодер Яндекса
- Syncthing (для синхронизации больших бинарных файлов)
Languages
Jupyter Notebook
97.8%
Python
2.2%