7. *nvv2021/06/01 08:41
[ответить]
.
>>6.777
>А срез за год?..
За год — хлопотно (из-за особенностей публикуемой статистики разделов). Но попробовал: «за полугодие», «за квартал» и некоторые иные варианты выборки/сортировки. Оказалось — неинтересно. Ни мне, ни другим. Посещаемость – раз в тридцать меньше, чем у выборки «за месяц». Полагаю, в силу того, что в СИ сосуществуют три основных категории интересных произведений — «вечное» (лежит уже давно и никуда не денется со своей стабильной, но невысокой средней посещаемостью), «текущее» (свежие творения мэтров СИ) и «сиюминутное» (может сгинуть в любой момент, но может оказаться и новой восходящей «звездой "Самиздата"»;).
Выявить первое моими выборками — шансов немного, хотя и есть. И здесь лучше подходят именно краткосрочные выборки, так как интерес к тому или иному «старичку» может вспыхнуть в любой момент и быстро угасает… А чем меньше интервал выборки, тем заметней случайный всплеск /интереса-с/. С другой стороны — среднесрочная выборка отсекает «мотыльков», так и не удержавших внимание публики, но позволяет заметить свежие таланты, сопоставимые по популярности с мэтрами.
Лично я ловлю интересное мне, просматривая всё (с объёмом страницы больше 20k), попавшее в шорт-листы siTopTexts и siTopAuthors. Под полторы тысячи каждый раз. После исключения уже известного, остаётся очередной десяток-другой текстов «на посмотреть». Каждые несколько дней. ;)
P.S. Возможно вам будут интересны подборки /моих/ прошлых выборок: «История-Р, "прикопанное" прошлое (ссылки на подборки старых рейтингов по полугодиям)» (http://samlib.ru/n/nosow_w_w/si_top-old_ones.shtml).
.
6. 7772021/05/31 18:27
[ответить]
Спасибо!
А срез за год?..
5. *nvv2021/05/31 15:29
[ответить]
....
Привет: «777».
>>3.777
>А рейтинги и популярность произведений можно как-то вытащить?
>Когда-то очень давно пользователь с ником Tony (если правильно помню) делал такое, для стекстов СИ начиная с определенного размера/рейтинга/популярности
(увы мне, но) Я всего три года серьёзно занимаюсь СИ (то есть и не могу помнить упоминаемое вами прошлое). А касаемо того, что желательно «вытащить», то я не понимаю — зачем вытаскивать уже вытащенное (или о чём речь)?
Дело в том, что в октябре будет три года, как я собираю и публикую среднесрочный (последние тридцать дней) рейтинг самого популярного в СИ. В самом начале — это была тысяча наиболее посещаемых произведений, сейчас поменьше — около семисот /в 30.000 топовых разделах СИ. В настоящее время этот рейтинг называется: «siTopTexts "Произведения" ("Самиздат" за 30 дней)» (http://samlib.ru/n/nosow_w_w/si_top500look-curr.shtml) и обновляется каждые несколько дней (согласно обновлениям статистики разделов СИ).
+ С декабря обновляется и краткосрочное (несколько недавних дней) приложение: «siTopAuthors "Авторы" ("Самиздат" намедни)». В этом приложении самые посещаемые в последние дни разделы + самые посещаемые /в тех же границах/ произведения /из них/.
Мне все понятно.
3. 7772021/05/31 14:13
[ответить]
Благодарю!
А рейтинги и популярность произведений можно как-то вытащить?
Когда-то очень давно пользователь с ником Tony (если правильно помню) делал такое, для стекстов СИ начиная с определенного размера/рейтинга/популярности(? - не помню точно).
Ещё до того, как СИ стал менять рейтинги.
Было полезно, но потом все хорошее было прочитано:)
2. *nvv2021/05/31 12:39
[ответить]
.
Привет.
>>25.Korwav
>>>15.nvv
/реплики/ (что в недоступных - неизвестно;).
>Ваш скрипт учитывает каждую ссылку в посте (здесь нередко выкладывают посты со списками ссылок)?
Да, каждую, встреченную в потоке символов. Учитывалось всё, что можно /с оговорками/ рассматривать как ссылку. Текст скрипта, выявляющего и считающего «ссылки» приведён в приложении к результатам: «из гостевой Андрея Буревого» (см. заглавный текст: «Сосчитать? Не вопрос!» – там пока только одна выборка). Упрощённо: ищутся цепочки символов вида: «A.B/C» (например цепочка: «author.today/reader» – засчитывается).
>Ваш скрипт учитывает все ссылки вообще или только в оригинальном посте (/…/ если кто-либо пост с ссылкой /…/ вставит в свой ответ /.../)?
Все. Если в цитате осталось достаточно от рекомендованной в оригинале ссылки, оное засчитывалось отдельно. Таки это реплика уже со своей /хоть и процитированной/ ссылкой-то. ;)
NB. К сожалению, засчитывались и такие ссылки: «читать.попаданец/переселенец», но их количество ничтожно и не было смысла усложнять алгоритм из-за. Мне были интересны лидеры.
>>27.ogneyar 001
>>>9.nvv
>>Ну и только за последний год:
>Если не трудно, можно сделать по месяцам?
Нетрудно. Можно. Сделаю, если вы объясните мне зачем это нужно, и ваше «затем» будет приемлемо для меня.