powered by simpleCommunicator - 2.0.18     © 2024 Programmizd 02
Map
Форумы / Вопросы по форуму [закрыт для гостей] / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!, Поиск: Искать сообщения, созданные автором: Green  
5 сообщений из 5, страница 1 из 1
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #481170
Фотография Green
Скрыть профиль Поместить в игнор-лист
Участник
basename  14.07.2023, 19:16
[игнорируется]
Смежные темы

Грядёт нечто ГРОМАДНОЕ в рамках реорганизации форума! Вспомнить всё!
Ноутбук Деды!
Цитата 
[игнорируется]
За год до СВО я тоже мутил проект:) У меня кое что есть

Выкачивание ПТ

Форум ПТ на sql.ru прекратил существование быстро и неожиданно 3 августа 2018 года. Темы и сообщения не были удалены физически, жужель просто в коде поставил заслонку
If ПТ then Облом
Поэтому доступ отсутствует даже у модераторов. Однако через поиск и избранные темы еще видны, но войти в них нельзя.
Казалось бы, шансов подобраться к постам никаких, но нашелся въедливый участник форума, который таки нашел лазейку. При вызове поста на цитирование защиты нет. Об этой лазейке он сообщил мне, я как узнал о ней сразу проверил еще одну догадку – вызов поста на редактирование. Оно тоже оказалось незащищенным, более того любой модератор может вызывать на редактирование любой пост, даже если он не в подотчетном форуме.
Это был охуенный шанс. Решением было просто пробежаться по всем постам от 1 до 22000000. Изначально мы не знаем какой теме и какому форуму принадлежит пост, поэтому бежать нужно через все и проверять.
Вызвать пост на редактирование и забрать BB код. Это намного лучше и эффективнее чем обратный парсинг HTML.
Но у этого решения был ряд ограничений, многие из которых удалось решить, но не все.
Проблема 1: При вызове на редактирование не подгружается ни дата поста, ни id топика, ни id форума. Но название топика есть!
Узнать id топика.
Переходим напрямую к текущему сообщению по id сообщения, получаем отлуп что тема не доступна, но в урл уже фигугирует id топика.
Узнать id форума.
Добавляем топик по известному id топика в избранное, напротив него в таблице появляется название и id форума. Выпарсиваем его.

Узнать дату поста.
Тут только приблизительно. Но хорошо то, что кроме ПТ часто постили и на других форумах, так что когда мы бежим по постам, мы сохраняем дату последнего поста, если пост доступен (потому что он на неудаленных форумах), и когда нарываемся на пост из ПТ, берем дату последнего доступного поста. Таким образом неточность даты времени не превышала пары часов, а основном пары минут.
Проблема 2: Аттачменты недоступны.
У жужеля 1 пост 1 аттачмент, выдергивать их легко, но там тоже стоит залонка
If ПТ then Облом
И режим редактирования здесь не поможет.
Частичное решение я нашел, но его нельзя было использовать массово. Решение – перенос темы в форум Тест, выкачивание аттачей, возврат темы обратно.
Для тем А51 у жужеля оказался еще какой-то запрет. Переносить оттуда их оказалось нельзя. Так что аттачи из А51 недоступны совершенно.
Для тем ПТ с аттачами есть одна проблема. Перенос темы отражается в модераторском логе. Если бы я переносил десятки тысяч тем из ПТ и обратно, весь модерлог был бы засран моими логами переноса и я бы спалился моментально, мне дали бы гусем по пизде.
Поэтому я решил медленно и осторожно переносить только самые важные темы которые я таковыми счел. Тем не менее дмидек меня все равно спалил, но эту акцию я приурочил к недоступности скруля в течении нескольких суток – типа разволновался что скруль совсем всё и решил спасти пару тем для истории.
Возможно в будущем когда / если жужель будет закрывать скруль, можно будет провернуть эту акцию со всеми темами ПТ. А может даже он раздобрится и даст доступ по нормальному на время.
Проблема 3: Удаленные посты недоступны ни на редактирование ни на цитирование (выдается error 500). Удаленные темы доступны без проблем.
Решается аналогично – путем переноса темы в Тест и просмотра в режиме удаленных. Тут уже парсинг другой. На редактирование вызвать нельзя, пришлось делать обратный парсинг HTML удаленных постов.
Точно также переносил лишь темы которые счел важными.
Весь этот сложный процесс в итоге показал скорость скачивания 90-110 постов в минуту. В пересчете на дни это где то 150 дней. Чтобы ускорить этот процесс я сделал два процесса – из пункта А и Б два поезда выехали навстречу друг другу. Один процесс парсил сначала, другой с конца, и в один прекрасный день они встретились.
В общем с перерывами я выкачал посты за 127 дней, и у меня есть почти полноценный архив ПТ и А51.
Цитата 
[игнорируется]
Эту акцию я назвал "Проект Дикобраз" и даже уже подготовил архим под урлом dikobraz.nosql.ru :)
А если бы жужиль замутил ORM модель, то шансов скачать не было бы )))
...
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #489411
Фотография Green
Скрыть профиль Поместить в игнор-лист
Участник
Sparrow  26.07.2023, 09:50
[игнорируется]
Вы пробовали жить в лондоне?
Сказали санкции его правительство, а он выполнил. Британское правительство не наше правительство.
...
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #489412
Фотография Green
Скрыть профиль Поместить в игнор-лист
Участник
Sparrow  26.07.2023, 09:40
[игнорируется]
Antonariy  26.07.2023, 07:55
[игнорируется]
eNose  15.07.2023, 18:03
[игнорируется]
Но вообще жужель пидор конченый.
Сделал бы ридонли и всё.
Нахуя было глушить сервак?
Ответ в вопросе.
Джуже был хороший ,пока молодой, потом приложится к бутылке и скурвился.
Откуда данные что он к бтылке приложился?
...
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #710420
Фотография Green
Скрыть профиль Поместить в игнор-лист
Участник
Администратор  25.01.2024, 17:56
[игнорируется]
Гарыныч  25.01.2024, 17:55
[игнорируется]
Администратор  25.01.2024, 17:54
[игнорируется]
Гарыныч  25.01.2024, 17:52
[игнорируется]
Администратор  25.01.2024, 17:50
[игнорируется]
...
давай, хуячь лажу .... :)))
зы:
2024-01-25_17-50-35.png
Это че такое?
такой же вопрос к тебе, что за хню ты мне прислал?
Я тебе прислал ответ деды на твою просьбу
А Горыныч прислал картинку с мусором.
...
Рейтинг: 0 / 0
Вопросы по форуму / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
    #710450
Фотография Green
Скрыть профиль Поместить в игнор-лист
Участник
Гарыныч  25.01.2024, 18:41
[игнорируется]
Администратор  25.01.2024, 18:38
[игнорируется]
Гарыныч  25.01.2024, 18:34
[игнорируется]
Администратор  25.01.2024, 18:18
[игнорируется]
Гарыныч  25.01.2024, 18:13
[игнорируется]
...
бывает, не реви
а я и не реву, не за себя просил
тогда пошёл на фиг
ты- ГНИДА
А почему ЗЕМЛЯНЫМ ЧЕРВЯЧКОМ не обозвал? Земляным чарвечечеком [:biggrin2]
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / Вопросы по форуму [закрыт для гостей] / Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!, Поиск: Искать сообщения, созданные автором: Green  
Читали тему (3): Анонимы (2), Yandex Bot 5 мин.
Игнорируют тему (1): erbol
Читали форум (10): Анонимы (8), Bing Bot, Yandex Bot 1 мин.
Пользователи онлайн (106): Анонимы (96), Bing Bot, IT-Клоп, MaksRoman0w, Yandex Bot, Ибрагимов Мага 82 1 мин., XEugene 2 мин., s62 3 мин., sergey11 3 мин., Сталкер 7 мин., Tabula Rasa 8 мин.
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]