|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Смежные темы Грядёт нечто ГРОМАДНОЕ в рамках реорганизации форума! Вспомнить всё! Ноутбук Деды! Уважаемый Кролег! Важно! Внимание! Просьба! Очень важная и глобальная задача, если тебе интересно! БД SQL.RU восстановлена ReSQL.ru Восстановлен SQL.RU Цитата [игнорируется] За год до СВО я тоже мутил проект:) У меня кое что есть Выкачивание ПТ Форум ПТ на sql.ru прекратил существование быстро и неожиданно 3 августа 2018 года. Темы и сообщения не были удалены физически, жужель просто в коде поставил заслонку If ПТ then Облом Поэтому доступ отсутствует даже у модераторов. Однако через поиск и избранные темы еще видны, но войти в них нельзя. Казалось бы, шансов подобраться к постам никаких, но нашелся въедливый участник форума, который таки нашел лазейку. При вызове поста на цитирование защиты нет. Об этой лазейке он сообщил мне, я как узнал о ней сразу проверил еще одну догадку – вызов поста на редактирование. Оно тоже оказалось незащищенным, более того любой модератор может вызывать на редактирование любой пост, даже если он не в подотчетном форуме. Это был охуенный шанс. Решением было просто пробежаться по всем постам от 1 до 22000000. Изначально мы не знаем какой теме и какому форуму принадлежит пост, поэтому бежать нужно через все и проверять. Вызвать пост на редактирование и забрать BB код. Это намного лучше и эффективнее чем обратный парсинг HTML. Но у этого решения был ряд ограничений, многие из которых удалось решить, но не все. Проблема 1: При вызове на редактирование не подгружается ни дата поста, ни id топика, ни id форума. Но название топика есть! Узнать id топика. Переходим напрямую к текущему сообщению по id сообщения, получаем отлуп что тема не доступна, но в урл уже фигугирует id топика. Узнать id форума. Добавляем топик по известному id топика в избранное, напротив него в таблице появляется название и id форума. Выпарсиваем его. Узнать дату поста. Тут только приблизительно. Но хорошо то, что кроме ПТ часто постили и на других форумах, так что когда мы бежим по постам, мы сохраняем дату последнего поста, если пост доступен (потому что он на неудаленных форумах), и когда нарываемся на пост из ПТ, берем дату последнего доступного поста. Таким образом неточность даты времени не превышала пары часов, а основном пары минут. Проблема 2: Аттачменты недоступны. У жужеля 1 пост 1 аттачмент, выдергивать их легко, но там тоже стоит залонка If ПТ then Облом И режим редактирования здесь не поможет. Частичное решение я нашел, но его нельзя было использовать массово. Решение – перенос темы в форум Тест, выкачивание аттачей, возврат темы обратно. Для тем А51 у жужеля оказался еще какой-то запрет. Переносить оттуда их оказалось нельзя. Так что аттачи из А51 недоступны совершенно. Для тем ПТ с аттачами есть одна проблема. Перенос темы отражается в модераторском логе. Если бы я переносил десятки тысяч тем из ПТ и обратно, весь модерлог был бы засран моими логами переноса и я бы спалился моментально, мне дали бы гусем по пизде. Поэтому я решил медленно и осторожно переносить только самые важные темы которые я таковыми счел. Тем не менее дмидек меня все равно спалил, но эту акцию я приурочил к недоступности скруля в течении нескольких суток – типа разволновался что скруль совсем всё и решил спасти пару тем для истории. Возможно в будущем когда / если жужель будет закрывать скруль, можно будет провернуть эту акцию со всеми темами ПТ. А может даже он раздобрится и даст доступ по нормальному на время. Проблема 3: Удаленные посты недоступны ни на редактирование ни на цитирование (выдается error 500). Удаленные темы доступны без проблем. Решается аналогично – путем переноса темы в Тест и просмотра в режиме удаленных. Тут уже парсинг другой. На редактирование вызвать нельзя, пришлось делать обратный парсинг HTML удаленных постов. Точно также переносил лишь темы которые счел важными. Весь этот сложный процесс в итоге показал скорость скачивания 90-110 постов в минуту. В пересчете на дни это где то 150 дней. Чтобы ускорить этот процесс я сделал два процесса – из пункта А и Б два поезда выехали навстречу друг другу. Один процесс парсил сначала, другой с конца, и в один прекрасный день они встретились. В общем с перерывами я выкачал посты за 127 дней, и у меня есть почти полноценный архив ПТ и А51. Цитата [игнорируется] Эту акцию я назвал "Проект Дикобраз" и даже уже подготовил архим под урлом dikobraz.nosql.ru :) ... |
|||
:
Изменено: 18.08.2023, 15:53 - Администратор
Нравится:
Гарыныч, Горбатый ёж
Не нравится:
|
|||
14.07.2023, 19:16 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
блять ты сам спросил чо такое премиум а теперь и чо? ты бычить что ли пытаешся сука? ты на кого сигналишь дядя бугога))) если знаешь, расскажи.... нех выёбываца, мана, не зли меня ... |
|||
деревья умирают стоя
:
Нравится:
Не нравится:
|
|||
25.01.2024, 23:17 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
ты обьясни, нахой, что там у тебя за преимиум, я в душе не ябу, что это... если знаешь, расскажи.... нех выёбываца, мана, не зли меня ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2024, 23:27 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
... если знаешь, расскажи.... нех выёбываца, мана, не зли меня ... |
|||
деревья умирают стоя
:
Нравится:
Не нравится:
|
|||
25.01.2024, 23:32 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
я не по это...., ябадь Базян запостил что-то из телеги ( возможно Пухловой телеги ) я зашёл в Пухлово телегу, посмотрел, месадж от Деды там не нашёл.... а тут ты с "премиумом"... вот я и спросил, что так можно?, прятать мессаги в телеге, если Премиум? ... |
|||
:
Изменено: 26.01.2024, 00:03 - Гарыныч
Нравится:
Не нравится:
|
|||
26.01.2024, 00:02 |
|
|
start [/forum/topic.php?fid=3&msg=710580&tid=11037]: |
0ms |
get settings: |
28ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
39ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
627ms |
get tp. blocked users: |
2ms |
others: | 16ms |
total: | 749ms |
0 / 0 |