Что интересного есть в архиве данных из ВК и какие занятные выводы из него можно сделать

Сегодня я выгрузил из ВК свои данные (что вы тоже можете и непременно должны сделать по вот этой ссылке) и решил посмотреть, что же интересного этот архив мне может рассказать как о самом ВК, так и обо мне

Andrey Viktorov
5 min readNov 20, 2018

Если вы знаете что такое GPG и как оно работает, рекомендую выгружать архив в зашифрованном виде. Я использовал для этого свой ключ с keybase и расшифровывал через консоль вот таким образом:

keybase pgp decrypt -i Archive_zip.gpg > Archive.zip

Удалённые сообщения

Начнем с того, что всех интересует больше всего — с удаленных сообщений.

Так как через сами выгруженные html-ки не очень удобно искать удаленные сообщения, я решил это сделать через консоль (не пугайтесь страшного скрипта (только для Mac и Linux), ВК почему-то выгружает html-ки в Windows-1251):

LC_CTYPE=ru_RU.CP1251 grep -rnwl . -e "`echo 'удалено'|iconv -f utf8 -t cp1251`"

Судя по увиденному мною (у вас могут получится другие результаты), вк действительно не включает в эту выборку удаленные сообщения, которые были удалены (это важный момент, не отправлены!) более чем год назад, ибо мне таковых найти не удалось.

Несмотря на то, что сообщение было отправлено в 2011 году и помечено как удаленное, удалил я его сегодня. Думаю, именно поэтому оно есть в выгруженных файлах

Но это совершенно не значит, что ВК действительно удаляет ваши сообщения спустя год/пол-года.

Так же следует помнить, что хоть вы и удаляете сообщения на своей стороне, они по-прежнему остаются у собеседника, и что происходит с ними после того, как их удалит он — загадка.

Другой забавный момент что удаленные групповые чаты так же включены в этот список как гора удаленных сообщений.

Список друзей

Из интересного там только одна вещь: дата, когда вы стали друзьями с человеком.

Удаленные записи со стены

Ничего, что было бы старше года и при этом удалено я в выгрузке не нашел. При том, что я постоянно удаляю все старые записи со стены, начиная с незапамятных времён. Удаляются ли они на самом деле? Чуть ниже подумаете вместе со мной и сами сделаете выводы.

Лайки

А вот тут и начинаются реально интересные вещи. При попытке посмотреть многие из моих лайков под фото я натыкался на такое:

Путем нехитрых манипуляций открываем страницу владельца этой фотографии:

Ой.

Поясняю, в чём заключается “Ой”:

Так как страница удалена, получается, что и её контент должен быть так же удалён. Однако, по какой-то причине в ВК всё еще хранятся данные о лайках под фото с удалённых страниц. Быть может, не такие они и удалённые, эти страницы?

То же самое касается лайков удаленных фото, видео, записей, и даже заметок (не знал, что под ними можно ставить лайки), что вызывает некоторые вопросы. Если фото удалено, почему хранится информация о том, кто его лайкнул? Действительно ли записи удаляются окончательно спустя год?

Фотографии

Почему-то я не нашел тут удаленных фотографий. Даже тех, которые были удалены сравнительно недавно. Сходу не понятно, хранит ли ВК какую-либо информацию о них или нет (но судя по тому, что у удаленных фото почему-то остаются в живых лайки — наверное, хранит)

История изменений имени

Тут есть не только успешные изменения, но и отклонённые попытки. Причем, за всё время жизни страницы.

Привязанные телефоны

Аналогично с именами — тут история за всё время.

Реклама

Тут очень много занятных вещей.

Например, я попал ажно в 3370 групп ретаргетинга:

“Интересы” в моём случае были совершенно нерелевантны, ибо там огромный список из всего подряд, зато, там попались весьма забавные “системные сегменты”:

Особенно последний!

Причем, судя по всему, “системные сегменты” еще и более-менее актуальные. Например, Firefox я пользуюсь всего вторую неделю, но Chrome в списке уже нет.

Не забавным мне показался следующий пункт в этом списке:

Часто посещаемые места

ВНИМАНИЕ! НИКОГДА НЕ ДАВАЙТЕ ВК ДОСТУП К ВАШЕМУ МЕСТОПОЛОЖЕНИЮ! ОТБЕРИТЕ У МОБИЛЬНОГО КЛИЕНТА ЭТО РАЗРЕШЕНИЕ, ЕСЛИ ОНО УЖЕ ЕСТЬ!

В моем случае (так как весьма давно забрал у ВК разрешение на геолокацию) там было только одно место — наш старый офис, но было оно с пометкой “Популярное место”.

Подозреваю, что помимо “часто посещаемых мест” ВК так же хранит и “нечасто посещаемые места”, ибо сделать вывод о частоте можно только обладая историей.

Повторюсь, срочно отберите у приложения разрешение на геолокацию и не загружайте в ВК фото с геометками.

Сеансы авторизации

В выгрузке указана информация о IP-адресах по 31 октября включительно. Но все мы прекрасно знаем, что ВК на самом деле хранит их куда дольше. Я обратился в саппорт с вопросом “а сколько реально хранится история IP-адресов?”, подождем ответа.

Импортированные контакты

В моем случае их оказалось сравнительно немного, но НИКОГДА не давайте ВК доступ к импорту контактов. Также я не нашел никакого способа их оттуда удалить, так что написал в саппорт и на эту тему.

Чего не нашлось в выгруженном архиве, но оно указано на странице “Защита данных” самого ВК

  1. История IP-адресов более чем за 21 день

В России ВКонтакте внесена в реестр организаторов распространения информации в интернете, поэтому обязана хранить переписку российских пользователей в течение шести месяцев, другую информацию о них — в течение года (согласно п. 3 ст. 10.1 Федерального закона «Об информации, информационных технологиях и о защите информации»).

Исходя из этого утверждения, ВК обязана хранить информацию о пользователях в течении года. Маловероятно, что ВК не хранит IP-адреса только за 21 день.

2. История поиска

К примеру, в видео есть “Недавние запросы”, но в выгруженном архиве я такого не нашел.

3. Уведомления

Выводы и дальнейшие действия

По итогу остались следующие вопросы:

  1. Почему хранятся лайки под удаленными записями, фотографиями, etc, а так же под контентом удаленных пользователей?
  2. За сколько дней реально хранится история IP-адресов?
  3. Как удалить импортированные контакты?

Конечно, самый идеальный вариант — удалиться из ВК. Понятное дело, что это не так и просто как кажется, например я это делать пока не планирую, ибо с многими людьми просто нет другой связи.

Но вот небольшой список шагов, которые вы можете сделать:

  1. Заберите у приложения ВК все лишние разрешения. Особенно на геолокацию
  2. Установите плагин Disconnect, чтобы вк не ходил за вами по интернету через виджеты
  3. Ограничьте потребление контента через ВК
  4. По-минимуму пользуйтесь ВК как мессенджером, по возможности общайтесь через другие мессенджеры.

--

--