|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Смежные темы Грядёт нечто ГРОМАДНОЕ в рамках реорганизации форума! Вспомнить всё! Ноутбук Деды! Уважаемый Кролег! Важно! Внимание! Просьба! Очень важная и глобальная задача, если тебе интересно! БД SQL.RU восстановлена ReSQL.ru Восстановлен SQL.RU Цитата [игнорируется] За год до СВО я тоже мутил проект:) У меня кое что есть Выкачивание ПТ Форум ПТ на sql.ru прекратил существование быстро и неожиданно 3 августа 2018 года. Темы и сообщения не были удалены физически, жужель просто в коде поставил заслонку If ПТ then Облом Поэтому доступ отсутствует даже у модераторов. Однако через поиск и избранные темы еще видны, но войти в них нельзя. Казалось бы, шансов подобраться к постам никаких, но нашелся въедливый участник форума, который таки нашел лазейку. При вызове поста на цитирование защиты нет. Об этой лазейке он сообщил мне, я как узнал о ней сразу проверил еще одну догадку – вызов поста на редактирование. Оно тоже оказалось незащищенным, более того любой модератор может вызывать на редактирование любой пост, даже если он не в подотчетном форуме. Это был охуенный шанс. Решением было просто пробежаться по всем постам от 1 до 22000000. Изначально мы не знаем какой теме и какому форуму принадлежит пост, поэтому бежать нужно через все и проверять. Вызвать пост на редактирование и забрать BB код. Это намного лучше и эффективнее чем обратный парсинг HTML. Но у этого решения был ряд ограничений, многие из которых удалось решить, но не все. Проблема 1: При вызове на редактирование не подгружается ни дата поста, ни id топика, ни id форума. Но название топика есть! Узнать id топика. Переходим напрямую к текущему сообщению по id сообщения, получаем отлуп что тема не доступна, но в урл уже фигугирует id топика. Узнать id форума. Добавляем топик по известному id топика в избранное, напротив него в таблице появляется название и id форума. Выпарсиваем его. Узнать дату поста. Тут только приблизительно. Но хорошо то, что кроме ПТ часто постили и на других форумах, так что когда мы бежим по постам, мы сохраняем дату последнего поста, если пост доступен (потому что он на неудаленных форумах), и когда нарываемся на пост из ПТ, берем дату последнего доступного поста. Таким образом неточность даты времени не превышала пары часов, а основном пары минут. Проблема 2: Аттачменты недоступны. У жужеля 1 пост 1 аттачмент, выдергивать их легко, но там тоже стоит залонка If ПТ then Облом И режим редактирования здесь не поможет. Частичное решение я нашел, но его нельзя было использовать массово. Решение – перенос темы в форум Тест, выкачивание аттачей, возврат темы обратно. Для тем А51 у жужеля оказался еще какой-то запрет. Переносить оттуда их оказалось нельзя. Так что аттачи из А51 недоступны совершенно. Для тем ПТ с аттачами есть одна проблема. Перенос темы отражается в модераторском логе. Если бы я переносил десятки тысяч тем из ПТ и обратно, весь модерлог был бы засран моими логами переноса и я бы спалился моментально, мне дали бы гусем по пизде. Поэтому я решил медленно и осторожно переносить только самые важные темы которые я таковыми счел. Тем не менее дмидек меня все равно спалил, но эту акцию я приурочил к недоступности скруля в течении нескольких суток – типа разволновался что скруль совсем всё и решил спасти пару тем для истории. Возможно в будущем когда / если жужель будет закрывать скруль, можно будет провернуть эту акцию со всеми темами ПТ. А может даже он раздобрится и даст доступ по нормальному на время. Проблема 3: Удаленные посты недоступны ни на редактирование ни на цитирование (выдается error 500). Удаленные темы доступны без проблем. Решается аналогично – путем переноса темы в Тест и просмотра в режиме удаленных. Тут уже парсинг другой. На редактирование вызвать нельзя, пришлось делать обратный парсинг HTML удаленных постов. Точно также переносил лишь темы которые счел важными. Весь этот сложный процесс в итоге показал скорость скачивания 90-110 постов в минуту. В пересчете на дни это где то 150 дней. Чтобы ускорить этот процесс я сделал два процесса – из пункта А и Б два поезда выехали навстречу друг другу. Один процесс парсил сначала, другой с конца, и в один прекрасный день они встретились. В общем с перерывами я выкачал посты за 127 дней, и у меня есть почти полноценный архив ПТ и А51. Цитата [игнорируется] Эту акцию я назвал "Проект Дикобраз" и даже уже подготовил архим под урлом dikobraz.nosql.ru :) ... |
|||
:
Изменено: 18.08.2023, 15:53 - Администратор
Нравится:
Гарыныч, Горбатый ёж
Не нравится:
|
|||
14.07.2023, 19:16 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Вы пробовали жить в лондоне? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 10:08 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Откуда данные что он к бтылке приложился? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 10:08 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Откуда данные что он к бтылке приложился? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 10:50 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
#490051
Ссылка:
Ссылка на сообщение:
Ссылка с названием темы:
Ссылка на профиль пользователя:
Ссылка на вложение:
Ссылка на вложение 2:
Ссылка на вложение 3:
|
||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
#18+
Сегодня продолжил мучения. Компетенций не хватает, как и места. Понадобилось дропнуть одну колонку, ненужную, для высвобождения места. Дык вот фиг там. Места, чтобы дропнуть - тоже не хватает. То есть, если воспользоваться простым методом alter table drop column - оно начинает эту большую таблицу копировать целиком и попутно ещё дописывает что-то там в свои служебные файлы. Вроде бы и места по размеру таблицы должно хватать, но нет. В результате создал таблицу клон и стал её заполнять данными из оригинала без одной колонки. Дык целиком тоже не получилось, памяти не хватает. Пришлось интервалами, по миллиону и удалять бинарные логи Короче, надо будет диск покупать на ноутбук и все переустанавливать. Увы ( А ведь ещё не дошёл до данны Кролика! но уже попробовал их. P.S. КТО-НИБУДЬ МОЖЕТ ОБЪЯСНИТЬ, ЗАЧЕМ МНЕ ВСЁ ЭТО НУЖНО? ... |
||||||||||||||||||||||
:
Нравится:
Не нравится:
|
||||||||||||||||||||||
26.07.2023, 21:04 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Сегодня продолжил мучения. Компетенций не хватает, как и места. Понадобилось дропнуть одну колонку, ненужную, для высвобождения места. Дык вот фиг там. Места, чтобы дропнуть - тоже не хватает. То есть, если воспользоваться простым методом alter table drop column - оно начинает эту большую таблицу копировать целиком и попутно ещё дописывает что-то там в свои служебные файлы. Вроде бы и места по размеру таблицы должно хватать, но нет. В результате создал таблицу клон и стал её заполнять данными из оригинала без одной колонки. Дык целиком тоже не получилось, памяти не хватает. Пришлось интервалами, по миллиону и удалять бинарные логи Короче, надо будет диск покупать на ноутбук и все переустанавливать. Увы ( А ведь ещё не дошёл до данны Кролика! но уже попробовал их. P.S. КТО-НИБУДЬ МОЖЕТ ОБЪЯСНИТЬ, ЗАЧЕМ МНЕ ВСЁ ЭТО НУЖНО? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 21:34 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
P.S. КТО-НИБУДЬ МОЖЕТ ОБЪЯСНИТЬ, ЗАЧЕМ МНЕ ВСЁ ЭТО НУЖНО? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 21:34 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Сегодня продолжил мучения. Компетенций не хватает, как и места. Понадобилось дропнуть одну колонку, ненужную, для высвобождения места. Дык вот фиг там. Места, чтобы дропнуть - тоже не хватает. То есть, если воспользоваться простым методом alter table drop column - оно начинает эту большую таблицу копировать целиком и попутно ещё дописывает что-то там в свои служебные файлы. Вроде бы и места по размеру таблицы должно хватать, но нет. В результате создал таблицу клон и стал её заполнять данными из оригинала без одной колонки. Дык целиком тоже не получилось, памяти не хватает. Пришлось интервалами, по миллиону и удалять бинарные логи Короче, надо будет диск покупать на ноутбук и все переустанавливать. Увы ( А ведь ещё не дошёл до данны Кролика! но уже попробовал их. P.S. КТО-НИБУДЬ МОЖЕТ ОБЪЯСНИТЬ, ЗАЧЕМ МНЕ ВСЁ ЭТО НУЖНО? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:33 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Эта задача под силу компетентным людям в данной области: Деду, Кролику. Мой профиль тут почти бесполезен. Тут нужен не одмин, а опытный, именно в сфере веб, php, sql разработчик. 1снник тоже не проканает. Так что, скорее всего можете забить на затею, а покупать диск - выкинутые деньги. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:38 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
а покупать диск - выкинутые деньги. ... |
|||
:
Изменено: 26.07.2023, 22:43 - Гарыныч
Нравится:
Не нравится:
|
|||
26.07.2023, 22:42 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Это бесполезно. Донатить нужно за результат. В результате только должен буду. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:44 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:47 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
а покупать диск - выкинутые деньги. зы: Базя, а у тебя разве нету обычного компа? ... |
|||
:
Изменено: 26.07.2023, 22:49 - Гарыныч
Нравится:
Не нравится:
|
|||
26.07.2023, 22:48 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
15 тыр рубасов на ССД на 2 терабайт для ноута нада.... ... |
|||
:
Изменено: 26.07.2023, 22:49 - Гарыныч
Нравится:
Не нравится:
|
|||
26.07.2023, 22:48 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Эта задача под силу компетентным людям в данной области: Деду, Кролику. Мой профиль тут почти бесполезен. Тут нужен не одмин, а опытный, именно в сфере веб, php, sql разработчик. 1снник тоже не проканает. Так что, скорее всего можете забить на затею, а покупать диск - выкинутые деньги. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:49 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Я 2 года назад за столько ниибацо пиздатый Самсунг 860 взял (ещё у Жука про реальность скидки 25% в их официальном магазине уточнял), сейчас все демократичнее гораздо. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:52 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
базя может не покупать диск , а позаимствовать на время задачи с возвратом ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:54 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
базя может не покупать диск , а позаимствовать на время задачи с возвратом ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:56 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
у меня есть 120гиг- взял для старого ноута еще не поставил ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:57 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Там база на 200 с лишним вроде как ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:58 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Я 2 года назад за столько ниибацо пиздатый Самсунг 860 взял (ещё у Жука про реальность скидки 25% в их официальном магазине уточнял), сейчас все демократичнее гораздо. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 22:59 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
есть еще HDD на 320гиг ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 23:00 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
В знаниях. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 23:00 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
а покупать диск - выкинутые деньги. зы: Базя, а у тебя разве нету обычного компа? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 23:01 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
тебе тема базоёбства не интересна ? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 23:01 |
|
Скандалы, интриги, расследования. "Проект Дикобраз". Привет от Деды!
|
|||
---|---|---|---|
#18+
Эта задача под силу компетентным людям в данной области: Деду, Кролику. Мой профиль тут почти бесполезен. Тут нужен не одмин, а опытный, именно в сфере веб, php, sql разработчик. 1снник тоже не проканает. Так что, скорее всего можете забить на затею, а покупать диск - выкинутые деньги. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.07.2023, 23:01 |
|
|
start [/forum/topic.php?fid=8&msg=490203&tid=11037]: |
0ms |
get settings: |
19ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
38ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
1860ms |
get tp. blocked users: |
2ms |
others: | 13ms |
total: | 1966ms |
0 / 0 |