ВнизНазадКаталогРазвернуть изображения
/_b/

「Мониторинг」

Аноним
GYdIqSnWaDs142 KB1825x879sosach speed.gif
Мониторю сосач, получил интересные результаты. Интересно будет посмотреть на скорость постинга в "праздники", когда TRVE битарды по-идее должны продолжать постить.
Аноним
Время UTC. Первый провал графике из-за нерегулярного сбора данных. Обратите внимание на тот факт, что когда б/а/вг проседают до минимальных значений, рф активизируется до максимальных.
Аноним
Аахахаха, сейчас глянул постинг в /a/ - максимум 1 сообщение в минуту. В то время как в /b/ было 46 постов в минуту. В /a/ мёртвая тишина, в /b/ вайп односложными постами. Хотя для сосача это не вайп, а "свободное общение".
Аноним
Любой сбор статистических данных, будь то для научных или чисто коммерческих целей, должен эти самые цели иметь. Если цели нет, то не стоит удивляться нерепрезентативности выводов.
И вообще методика выполнения измерений должна быть оценена на фальсифицируемость.
>>7258 #
Аноним
>>7257 #
Пока цель заявлена в ОП-посте. Это информация. Как её использовать уже другой вопрос. Можно предсказывать время когда лучше всего зафорсить что-нибудь или вайпнуть.
>И вообще методика выполнения измерений должна быть оценена на фальсифицируемость.
Ты не знаешь как вычислить скорость постинга? Количество постов/время. Конкретно сейчас 28 постов в минуту. Часа через 4 ожидается достижение максимума.
>>7259 #
Аноним
>>7258 #
> Как её использовать уже другой вопрос.
Вот о том и речь, что потом уже придется подстраиваться под то что уже собрал, а не сразу собирать то что тебе нужно.
>Можно предсказывать время когда лучше всего зафорсить что-нибудь или вайпнуть.
Скорее повысить вероятность поста не быть смытым в определенный промежуток времени. Больше сыра больше дырок, больше дырок меньше сыра, больше сыра = меньше сыра, логика идентичная. Не там корреляция просто, ну или она не велика. А вот смыть все, да, действительно удобней когда никого нет.
>Ты не знаешь как вычислить скорость постинга?
Я не знаю что из этой информации можно понять в отвязке от каких-то критериев самих сообщений и тех кто их отправляет. Эти данные даже нельзя оценить потом с точки зрения отношения сигнал/шум, в смысле вайп и остальные сообщения.
>Часа через 4 ожидается достижение максимума.
С каким мат.ожиданием? Как минимум нужно вести статистику не только измеряемой величины, но и предполагаемых влияющих величин.
>>7260 #
Аноним
>>7259 #
>потом уже придется подстраиваться
Что именно подстраивать?
>Скорее повысить вероятность поста не быть смытым в определенный промежуток времени.
Это тоже.
>Я не знаю что из этой информации можно понять в отвязке от каких-то критериев самих сообщений и тех кто их отправляет.
Это МЕТАДАННЫЕ. Можешь загуглить что из них можно вытянуть. Кстати, мне тоже надо это загуглить.
>С каким мат.ожиданием?
Не заморачивался этим.
>предполагаемых влияющих величин
Вот тут уже ты должен перевести свои глаза на ОП-пост и прочитать "Интересно будет посмотреть на скорость постинга в "праздники"". По некоторым причинам я не стану тут публиковать кое-какие сведения.
Много факторов. Я не мониторю содержимое сообщений. Потом сделаю для козляча и других мелкоборд, как когда-то был сайт со скоростью постинга.
>>7261 #
Аноним
>>7260 #
Подстраиваться под недостаточность данных, то есть делать выводы полагаясь только на косвенные данные. То есть, допустим ты не сможешь выяснить зависимость активности от каких-то еще влияющих событий, как внутренних так и внешних, потому что у тебя нет достаточного объема оказывающих влияние случаев и оценки веса этих событий. И я не говорю про какие-то сложные взаимосвязи, а обыкновенное влияние на количество постов с учетом дисперсии.
>Это тоже.
Не могу согласиться, так как никто не проверял достоверность и опросы населения не проводил. То что сообщения ушли, не означает то что они кем-то усвоились нужным тебе образом.
Понятие метаданные немного размыто и относится скорее к области описания, а не исследования взаимосвязей.
>Не заморачивался этим.
Вот тут как раз можно было бы и заморочится.
Как мне кажется, информация будет, как минимум, рассмотрена большим числом людей и реакция на нее будет более вероятная, когда она предвосхищает действия.
>"Интересно будет посмотреть на скорость постинга в "праздники"
Это всего лишь один из определенных во времени факторов. Но из имеющейся у тебя информации ты не получишь каких-то внятных объяснений происходящему. Поэтому осмысление целей наблюдения первично, а уже потом идет методология и сам сбор данных. Так-то если просто побаловаться, то это все вообще не важно, сам процесс наблюдения куда важней.
>>7264 #
Аноним
>>7261 #
>Подстраиваться под недостаточность данных, то есть делать выводы полагаясь только на косвенные данные.
Никто не ставит жёстких временных рамок. Можно дополнить данные и потом делать выводы.
>Понятие метаданные немного размыто
Понятие метаданных чётко определено.
>Как мне кажется, информация будет, как минимум, рассмотрена большим числом людей и реакция на нее будет более вероятная, когда она предвосхищает действия.
Вопрос притязательности вброса не рассматривается.
>Но из имеющейся у тебя информации ты не получишь каких-то внятных объяснений происходящему.
Вполне получу. Новый год, постинг падает. Вывод: сосачеры ебаное застольное быдло. Или чемпионат по футболу, постинг падает. Вывод: сосачеры дауны в пятом поколении.
>Поэтому осмысление целей наблюдения первично
Да чё ты всё никак не успокоишься. Если тебе хочется, то цель - обнаружение интересных корреляций. Ты хоть раз сканировал сеть? Хотя бы провайдерскую.
>>7267 #>>7275 #
Аноним
GYdIqSnWaDsEx32 KB543x4603nk.png
>>7264 #
> Вполне получу. Новый год, постинг падает. Вывод: сосачеры ебаное застольное быдло. Или чемпионат по футболу, постинг падает. Вывод: сосачеры дауны в пятом поколении.
Но ты не учитываешь другие внешние факторы, например сетевая авария, случайная блокировка сосача у части провайдеров из-за криворукости РКН и т. п.
Про застольное тоже относительно, может они ушли на синч смотреть аниме.
Короче как обычно лажают многие статистики. Берут данные какие-то и пытаются ВЫДУМАТЬ ИМ ОПРАВДАНИЕ.
Вот кстати по теме https://vas3k.ru/blog/379/
Аноним
Ещё минус когда статистик изначально предвзят/носит когнитивные искажения, поэтому видя удобные ему данные он сделает удобный ему вывод («сосачеры ебаное застольное быдло», «сосачеры дауны в пятом поколении»).
Унижение сосачеров конечно похвальное занятие, но это не имеет отношения к каким-то там достоверным результатам.
Аноним
>>7264 #
>обнаружение интересных корреляций
Только ты их не увидишь, потому что на это завязана огромная гора данных, которая является n-мерным массивом, и визуально ее оценивать вообще невозможно.
>>7282 #
Аноним
>>7275 #
Почему визуально невозможно? Если данные пришли ненормированные их надо нормализовать (привести к нормальной форме), дальше уже ими манипулировать будет заметно проще.
>>7283 #
Аноним
>>7282 #
Ты способен оценивать двадцать графиков в трех измерениях каждый?
>>7284 #
Аноним
>>7283 #
О каких данных вообще речь? Почему именно такие условия?
>>7300 #
Аноним
>>7267
>например сетевая авария
Об этом мы все узнаем. Как и о блокировке. И подкорректируем выводы.
>Берут данные какие-то и пытаются ВЫДУМАТЬ ИМ ОПРАВДАНИЕ.
Используется самое вероятное объяснение.
>>7275
>Только ты их не увидишь
Проседающий постинг к 5 утра по МСК это авария или блокировка? Хватит хуйню нести.
>>7284 #
Потому что он ебанулся и предлагает нихуя не говорить пока не соберёшь "все факторы". А то вдруг можно будет ошибиться и тебя "засмеют сосачеры".
>>7303 #>>7308 #
Аноним
Смешно конечно, когда в любительском коде предлагают решить проблему субъективного наблюдения. Тогда вообще всему стоит остановиться и решать только эту проблему.
>>7304 #
Аноним
>>7300 #
> Об этом мы все узнаем. Как и о блокировке. И подкорректируем выводы.
Это просто пример. Не обо всём ты можешь узнать. Тем более если ты не заглядываешь и не мониторишь содержимое самих сообщений, а тупо собираешь "мета-данные".
> Используется самое вероятное объяснение.
Вероятное с какой точки зрения? Статью всё же почитай там есть про систематические ошибки отбора, та же ошибка меткого стрелка.
>>7305 #
Аноним
>>7301 #
Конкретно я за объективную статистику, просто многие того не желая заблуждаются поэтому написал, если тебе насрать на это и ты делаешь это с целью просто пострадать хуйнёй то ок, дело твоё.
А парнишу с 10-мерными изменениями куда-то не туда уносит время от времени в разных темах.
>>7306 #
Аноним
>>7303 #
>Не обо всём ты можешь узнать.
Это не значит что нужно сидеть и ничего не делать. Фактор Икс всегда будет.
>Вероятное с какой точки зрения?
Не "с точки зрения", а объективно. На НГ идут бухать подавляющее большинство (или не бухать, но от компа отрываются). И случаются блокировки/экскаватор/отключение света. Но первое вероятнее всего. Опять же, это не формирование догмы, это наука. А научные знания постоянно дополняются и выводы корректируются со вновь поступившей информацией.
Аноним
>>7304 #
>за объективную статистику
Окей, оставим пиздёж, перейдём к конкретике. Что не хватает для того чтобы ТЫ посчитал статистику ОБЪЕКТИВНОЙ. Конкретно этот пример с мониторингом сосача.
Аноним
>>7300 #
Честно скажу, в вычислениях и собирании данных не силен, потому что занимался этим ровно один раз и очень давно и задача у меня была более сосредоточенная.
>"все факторы"
Не все, а наиболее значимые. В конкретно данном случае, проблемы достоверности датамайнинга начнется тогда, когда собирающий осознает масштаб того что собирает.
Для примера кратко опишу то, что уже не учитывается в данной статистике никак, но скорее всего оказывает наибольшее влияние:
1) Долготный эффект. У постящих нет единого времени, они все пишут в разное время и пик их активности соответственно не совпадает. Из этого уже следует количественное распределение с учетом долготного эффекта. Естественно что большинство в европейской части и ближнем зарубежье, но разница в час-два в их существовании все равно присутствует.
2) Социальная принадлежность. Нормис по ночам, как правило, ничего не пишут. Маргиналы, наоборот, до обеда спят. Оценивать это тоже нужно, но тут уже возникают сложности, потому что нужно анализировать содержание, к тому же мимикрировать никто не запретит.
3) Вес социальных групп. Тут вообще уже ничего не разберешь, кто, когда и почему.
4) Детерминированные во времени события. Должны быть сгруппированы и оцениваться единообразно. Иначе гомоскедастичность будет отсутствовать напрочь.
5) Погода и космические явления. Да-да, это бред. Но не будь я быдлом в пятом поколении, то бы такого не предлагал. На самом деле магнитные бури оказывают дурное влияние и люди становятся тревожными, а погода способна загнать с улицы в дом. И если магнитные бури в среднем однородное и его можно учесть, то погода всегда будет является весовым коэффициентом к пунктам 1 и 2. Еще есть температура воздуха, давление и влажность, но об этом лучше не вспоминать и описывать погоду по шкале комфорта.
6) Внешние социальные явления. Тут еще сложней, так как нужно оценивать не только посты, но и содержание причин почему начали квохтать.
7) Внутренние социальные явления.
8) Технические причины тормозящие постинг. Их тоже масса и носят они тоже неоднородный характер. Учитывать их практически невозможно. Делятся на "случайные" и намеренные, со всеми последствиями для последующего по результатам вброса обсуждения.
И это только крупными мазками, не описывая в килограммах что и как считать. Но в целом конечно все это просто и понятно, если есть что и понятно как собирать, хотя на целую диссертацию по социологии все равно хватит.
>>7309 #
Аноним
>>7308 #
1) Учитывается.
2) Учитывается. Глянь на график по /rf/.
3) Метаданных недостаточно.
4) Их пока не было.
5) Вот и составляй график магнитных бурь. Может будет корреляция.
6) Метаданные не для этого.
7) Там только сосака, остальные не имеют голоса вообще.
8) Какие там технические сложности? Капча долго вводится?
>>7311 #
Аноним
>>7309 #
1) Не учитывается. У тебя нет статистики пользователей и их региональной привязки.
2) Не учитывается. У тебя нет статистики пользователей.
3) Достаточно, просто измерения будут косвенными. Пользователей выдает их словарный запас, размер текста, наличие и содержание картинок. Но кто же это будет все анализировать и привязывать?
4) Были, только нет учета и шкалы значимости. К таким событиям, к примеру, относятся дни недели. И оценивать корректно субботу с субботой, а не то что на выходных постинг более вялый, относительно будней.
5) Мне достаточно знать ох влиянии на людей вообще.
7) А как же разного рода драмы?
8) Ну нет ведь никакой разницы. Нет ведь никакой разницы между тем что сервер упал, задудосили, капча отвалилась, надзорные органы прикрыли или домен отобрали. И обсуждать тоже это все будут одинаково одним лишь словосочетанием "отказано в обслуживании".
Но самый печальный момент в этой статистике то что она анонимная и количество сообщений от одного пользователя может на порядок перекрывать от других десяти.
>>7322 #
Аноним
GYdIqSnWaDs121 KB1794x826post.gif
>>7311 #
1) Достаточно определить когда постят по UTC.
2) Она выводится из данных.
3) Словарный запас сосачера и так известен.
4) Я имею ввиду что не было значимых уникальных, вроде ЧМ. Кстати, в пятницу постинг после обеда стал снижаться, что не было видно всю рабочую неделю. Пикрелейтед.
5) Хули твои знания-то? Знания ради знаний?
7) Когда сосака или его ёбыри не хотят чтобы что-то постили, то и постинга не будет. Можно конечно мониторить ВСЕ доски на предмет повышения постинга ввиду выдавливания основной массы заинтересованных из целевых разделов. По мне так это хуйня, т.к. растворяется в куче того кала что когда-то сосака назвала "свежей кровью". Упс, мета.
8) Ты понимаешь что это будет сразу видно и известно? Разумеется может быть что-то, что умолчали. Но хуле, на это и есть фактор Икс.
Считаю не людей, а внимание. Я ещё буду доделывать, сравнивать постинг за сутки, месяц. Это не самостоятельный или конечный инструмент.
>>7331 #
Аноним
>>7322 #
>5) Хули твои знания-то? Знания ради знаний?
Почему же, люди становятся злее и это очень даже заметно.
>Но хуле, на это и есть фактор Икс.
Этот фактор икс привязывается к последующей активности и будет выражен скорее все апериодической составляющей, наложенной на обычный периодический процесс с дневными и недельными ритмами.
Так-то понимание правильности выводов из статистики все равно придет только по результатам экстраполирования.
Аноним
Пфф, смотрте что на сосаче в коде страницы:
<!--
Ребята не стоит вскрывать этот код. Вы молодые, шутливые, вам все легко.
Это не то.
Это не Чикатило и даже не архивы спецслужб. Сюда лучше не лезть.
Серьезно, любой из вас будет жалеть. Лучше закройте код и забудьте что тут писалось.
Я вполне понимаю что данным сообщением вызову дополнительный интерес, но хочу сразу предостеречь пытливых - стоп.
Остальные просто не найдут...
-->
Кал ебаный пытается заигрывать.

НазадКаталогВверхЗакреплено внизу