Растолкованный PageRank


Оглавление (нажмите, чтобы открыть):

Солянка сборная от wmas

Растолкованный PageRank

Краткое знакомства с Google PageRank. Простейшая формула расчета PageRank, его предназначение и влияние на поисковую выдачу.

PageRank (с англ. ранг страниц) – это числовая величина, вычисляемая на основе алгоритма ссылочного ранжирования и используемая поисковыми системами для определения релевантности сайта заданному запросу. Проще говоря, чем больше ссылок, включающих в себя ключевые слова соответствующие поисковому запросу, тем сайт выше в выдаче.

Алгоритм PageRank был запатентован в США 4 сентября 2001 года. В качестве его изобретателя в патенте указан Лэрри Пейдж (англ. Larry Page), но официальным владельцем патента является Стэнфордский университет, в котором учились Лэрри Пейдж и Сергей Брин в момент подачи заявки на патент.

Узнать значение PageRank для той или иной веб-страницы, можно используя Google Toolbar. Если кнопка PageRank отсутствует – кликните значок «гаечного ключа» на панели инструментов, на вкладке «Инструменты» установите флажок «PageRank» и нажмите кнопку «Сохранить».

Также существует ряд сервисов, программ и других инструментов позволяющих, помимо всего прочего, получить значение PageRank, которое они обычно берут из того же источника, что и Google Toolbar. При этом стоит понимать, что значение от 0 до 10 является округленным и предназначено лишь для того, чтобы пользователь мог сориентироваться, но не более.

По всей видимости, формула расчета PageRank претерпела значительные изменения, но даже ее простейшая форма позволяет получить некоторые представления о том, как вычисляется это значение.

где PR(A) – это PageRank веб-страницы A ; d — коэффициент затухания, который обычно устанавливают равным 0,85; PR(T1) – PageRank веб-страницы донора, т.е. страницы ссылающейся на веб-страницу A ; C(T1) – количество ссылок с этой веб-страницы.

Следует учитывать, что вес (ранг) передаваемый с веб-страницы донора, зависит от количества размещенных на ней ссылок. К примеру, если на веб-страница донора, чей вес равен 1, имеется четыре ссылки, одна из которых ведет на веб-страницу акцептора (получателя), то передаваемый вес будет равен 1/4.

Конечно, все выше сказанное достаточно условно. Расчет PageRank куда сложнее и требует множество итераций (обработок), чтобы найти соответствующее истине значение. А если учесть, что веб-страницы могут «зацикливаться», т.е. создавать своеобразное кольца из ссылок друг на друга, становится понятно, что все не так просто как может показаться на первый взгляд.

Следует также понимать, что PageRank является лишь одним из множества факторов влияющих на поисковую выдачу. Тем не менее, пока он существует, ссылки будут рулить.

PageRank — что это такое и как его проверить

PageRank — это важный показатель, способный повлиять на выдачу в Google. Именно PR является ключевым моментом в работе поисковой системы Google, который предопределяет позицию сайта в выдаче по различным запросам.

Сегодня мы разберёмся — что он из себя представляет и как его проверить.

Практически каждый веб-сайт, который можно найти — напрямую зависит от поисковой системы в плане получения постоянного трафика. Именно поэтому всем известно, что с поисковой системой следует «дружить» и придерживаться всех её правил, дабы не попасть под такие неприятные вещи как пессимизация и уж тем более фильтр.

При просмотре различных ТОПовых сайтов по определенным запросам можно заметить конкуренцию за той или иной запрос, возникающую между ними — как же разрешаются подобные ситуации со стороны поисковой системы? Конечно же, существуют свои показатели и критерии, по которому сортируется контент и сайт получает своего рода ранг. Чем больше сайт соблюдает правил и содержит в себе качественный контент — тем выше позиции у него будут, остальные же будут располагаться под ним, либо будут иметь проблемы с выдачей. Проблемы могут быть, как я уже писал, в виде пессимизации, либо фильтра: среди которых мы уже рассмотрели нашумевшие Яндекс Минусинск, Google Penguin и Google Panda.

Что такое PageRank

Прежде всего стоит отметить, что такой алгоритм как PageRank был придуман пока ещё аспирантами Стэнфордского университета Ларри Пейджом и Сергеем Брином в 1998 году. Патент был создан лишь в 2001 году и принадлежит он Стэнфордскому университету, а не Google.

PageRank — один из алгоритмов ссылочного ранжирования, который назначает каждому документу свой индекс авторитетности (важности страницы), который выражается в виде определенной величины (принимает значение 0-10). Спецификой данного параметра является то, что он высчитывается в зависимости от веса ссылочной массы. Простыми словами: PR — это суммарный авторитет страницы, который напрямую зависит от всех ссылаемых на него сайтов и конечного получения общего веса этих ссылок. Именно вес всех ссылок и будет определять такое значение, как PageRank.

В целом, данный алгоритм схож с Яндекс тИЦ, отличием выступает лишь то, что PR высчитывается для каждой страницы, а тИЦ для всего сайта в общем. Основа аналогична взята с научного мира, по принципу: чем больше авторов ссылаются на труды, тем выше его качество и важность. В целом, параметры должны иметь схожий характер, но всё же имеют свою специфику, что мы и можем заметить повсеместно.

Следует отметить, что PR учитывает не количество ссылок, а именно их вес — так что огромное количество заспамленных ссылок не сделают картину, не говоря уже о последующих санкциях от различных фильтров. Это является ещё одним поводом проверять ссылки внимательно и выбирать только качественных доноров, во избежание всевозможных проблем, в том числе и с PageRank.

Если поразмышлять на тему отличия алгоритмов Яндекс и Google, то стоит вспомнить про такой показатель как вИЦ, принцип работы которого держится под семью замками сотрудниками поисковой системы. Имеет смысл провести параллель с алгоритмом PR — судя по всем фактам, они действительно имеют много общего… Но, увы, этого нам знать не дано. По крайней мере, на сегодняшний день.

В любом случае, существование такого алгоритма как PageRank и вИЦ является вполне закономерным: даже труд одного автора может иметь совершенно разное качество или важность отдельной статьи в какой-то ни было области (даже если брать первоначальную — науку). Не говоря уже о том, что на сайте могут быть целая команда авторов — различный вес каждой страницы должен иметь место быть, если рассуждать в плане качественного контента.

Особенности PR

Как вы уже поняли, без такого показателя как PR никакой речи о поисковом продвижении сайта быть не может — необходимо с ним поработать. Хочу сразу сказать — PageRank не сможет повлиять на продвижение сайта напрямую, так как он является вспомогательным, но очень полезным.

Его роль заключается именно в том, чтобы разрешить ситуацию, которую я описал вначале про конкуренцию нескольких сайтов по одному и тому же запросу — именно PR может предопределить исход и расположить на лучшие позиции те сайты, у которых этот показатель будет высоким.

Помимо этой ситуации — он поможет нам в такой интересное ситуации, когда пользователь вводит неоднозначный запрос. К таким запросам чаще всего относятся однословники — «сайт», «салат» и прочие общие запросы. По ним будет огромное количество соответствующих документов, которые хотя бы как-то будут причастны к данному запросу. Именно в этой ситуации PageRank сыграет ту самую решающую роль и может даже в таком запросе предоставить нам лучшие позиции.

PageRank имеет 2 значения:

В свою очередь постоянно обновляется и участвует непосредственно в ранжирование. Именно этот показатель измеряет точный вес, передаваемый ссылками.

Исходит из вещественного значения и представляет из себя некую оценку, которая может принимать значение 0-10. Обновляется достаточно редко — около 1 раза в месяц.

Нулевое тулбарное значение имеют чаще всего молодые проекты или те, кто попал под фильтр. Достигать всё более высокого уровня достаточно сложно, а некоторые ставят предел на 5.

Вещественное значение Тулбарное значение
0,00000001…5 1
6…25 2
26…125 3
126…625 4
626…3125 5
3126…15625 6
15626…78125 7
78126…390625 8
390626…1953125 9
1953126…∞ 10

Стоит отметить, что повышение PR можно добиться не только внешними ссылками с других сайтов, но и с помощью внутренней перелинковкой страниц — которую мы скоро рассмотрим. Тем самым, можно поднять показатель PR, совершенно не прибегая к использованием внешних ссылок, но идеальным вариантом является комбинация обоих способов.

Как проверить показатель PageRank

Для проверки PR существуют множество сервисов, выбор которого зависит только от вас — так как практически все из них выполняют свою работу корректно.

Сервис проверки PR — Raskruty — отлично справляется с своей задачей. Интерфейс сервиса крайне прост: достаточно ввести одну или несколько ссылок на сайт, нажать «проверить PR» и получить значение PageRank. Он идеально подходит для массовой проверки одного или даже нескольких проектов — что значительно упрощает задачу и делает сервис приятным в использовании.

Помимо этого, существует масса расширений для любого браузера, что позволяет просматривать PR и другие SEO показатели, не используя сервис — в режиме реального времени. Это очень удобно, если есть необходимость в постоянном просмотре данных о сайте.

Если вы хотите просматривать информацию о вашем показателе PR на сайте — можно установить специальный счётчик, который может предоставить такой сервис, как PR-CY . В данном сервисе можно получать не только PR, но и тИЦ сайта в виде небольшого виджета. Как установить можно прочитать в этой статье — там описан алгоритм установки счётчика Яндекс Метрики, но таким способом можно устанавливать абсолютно любой счетчик. Разницей может быть лишь месторасположение — если счётчик нужен в футере, то его необходимо поместить в необходимом шаблоне, не нарушая структуру тегов.

Мастер Йода рекомендует:  Лекция 5. AutoPostBack Привязка к данным. Коллекции. Проверка правильности вводимых данных.

Для массовой или автоматизированной проверки всех страниц сайта можно воспользоваться специальными сервисами, о которых мы поговорим в следующей статье. На этом я с вами прощаюсь — надеюсь информация была полезна и актуальна для вас!

Что такое PageRank?

Больше полезных статей, кейсов и мануалов. Подпишись на обновления!

PageRank или пейдж-ранк – один из алгоритмов ссылочного ранжирования в поисковой системе Google.

Этот показательно может быть от 0 до 10. На базе алгоритма ранжирования PageRank появился Гугл .

Если PageRank дать точное определение то:

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.

PageRank рассчитывается для каждой страницы, и если делать грамотную структуру сайта, его можно распределить равномерно или под нужные задачи по сайту.

Как можно проверить PageRank

Пейдж-ранк можно проверить с помощью разных сервисов или тулбаров в браузерах. Например, у сайта google.com PageRank 9, из 10.

Сервисы для проверки PR:

Так де это можно сделать с помощью тулбаров, как:

seoquake.com
developing.ru/seobar
recipdonor.com/bar

Как было сказано ниже, PageRank влияет на ранжирование сайта, и если на продвигаемый сайт будут ссылаться множество ссылок с высоким пейдж-ранк, то это PR вашего сайта вырастет.

Основная формула, которая описывает PR:

Довольно таки обширную статью написал Александр Садовский, про растолкованный PageRank, статью читаем здесь


Книги по Google PageRank

— Google’s PageRank and Beyond: The Science of Search Engine Rankings

Данная книга с кучей формул, и для ее успешного чтения как минимум нужно хорошо знать математику

Часто задают такие вопросы

Как повысить PR сайта?

На самом деле есть много способов это сделать, самый простой и часто распространённый – это поставить ссылки с сайтов, на которых высокий PR, и когда поисковая система учтет ссылки, и сделает обновление алгоритма, он повысится на вашем сайте.

Когда и как часто обновляется PageRank?

Раньше PR обновлялся раз в 3-4 месяца, сейчас он обновляется по-разному, и нет четких интервалов, это может быть 1-3 раза в год.

Это обновление тулбарного (того что мы видим) пейдж-ранк, внутренний PR скорее всего обновляется чаще.

Влияет ли посещаемость сайта на PageRank?

Нет, не влияет. На PageRank влияет количество и качество ссылок, которые ссылаются на сайт.

PageRank – один из алгоритмов ранжирования поисковой системы Google. Чем выше он на вашем сайте, тем лучше.

Google PageRank сайта или как поднять сайт за счет PR

PR (аббревиатура PageRank, пэйдж-ранк) — алгоритм ссылочного ранжировнаия, который применяется Google для измерения важности документа (страницы сайта) среди других. Google Pagerank определяет индекс авторитетности (числовую велчикину) для веб-страниц связанных между собой ссылками. Авторитетность страницы сайта (pagerank) определяется из соотношения количества и качества входящих ссылок. Чем больше на страницу установлено ссылок, тем большей важностью она обладает. Однако, кроме количества внешних ссылок, в расчете PR играет важную роль игрет качество внешних ссылок или вес страниц, с которых установлены ссылки.

PageRank — не влияет на позиции сайта в результатах поиска Google напрямую, так как является одним из множества методов определения релевантности страницы сайта. Если бы PR напрямую влиял на поиск, то на первых позициях были только сайты с высоким ПейджРанк. Однако, можно допустить, что при равных прочих, сайт с высоким PR будет занимать более высокую позицию, нежели сайт меньшим page rank. Google учитывает не только авторитетность, но и релевантность страниц. Но при этом пишет:

Где узнать и как проверить PageRank сайта

Чаще всего, узнать PageRank сайта можно в виде целого значения от 0 до 10, однако PR — это вещественное число имеющее множество градаций. Google page rank рассчитывается для каждой страницы в отдельности и у различных страниц сайта может быть разный PR. Изначальный PageRank любой страницы — 0. Если для перехода от PR0 к pagerank 1 требуется один шаг, то каждый последующий уровень набрать значительно труднее. Чтобы узнать pagerank сайта, достаточно установить в браузер Google Toolbar. В тулбар уже включена проверка pagerank, возможно потребуется включить отображение PR страниц. Таким образом, для каждой страницы можно проверить Page rank автоматически.

Алгоритм PageRank

Достоверно сказать как Google производит расчет pagerank сложно. Всевозможных аглоритмов расчета PR в интернете предостаточно, но они способны отразить только общую специфику учета параметров в формуле расчета PageRank. Алгоритм расчета PR, основан на передаче собственного пейдж ранк страницы, между страницами на которые она ссылается. То есть, чем больше раз ссылается страница, тем меньше веса она передает каждой ссылке, так как он делится между всеми ссылками равнозначно.

Кроме всего прочего, при расчете PR страницы учитывается схожесть тематики сайтов донора и акцептора, релевантность текста ссылки, время существование сайта и ссылки. Контент страницы не учитывается при расчетет PageRank, однако, он учитывается в поиске и важен для поисковой оптимизации сайта. Иногда можно понаблюдать эффект, когда page rank снижается из-за добавления новых страниц на сайт. Это происходит потому, что страницы сайта отдают часть своего ПейджРанк новым страницам. Подобное сложно заметить на крупных сайтах, но на небольших ресурсах может быть заметно.

PageRank постоянно пересчитывается, а алгоритм PR совершенствуется. В результате чего, строить прогноз PageRank’а можно очень приблизительно. Куда важнее повышать качество контента страниц и улучшать структуру сайта, чтобы получить естественную цитируемость и более высокий PR.

Как поднять Google PageRank

Вопросом как повысить Google Pagerank задается каждый, кто продвигает сайта в поиске или продает ссылки. Ведь PR является показателем важности и популярности ресурса, а значит эффективности работы. Существуют различные способы как увеличить PageRank. Принципиально их можно поделить на естественные и неестественные. Если неестественно быстро поднять Pagerank, то можно естественно получить бан от Google, пенальти или полное обнуление PR, так как подобные меры увеличения или вовсе накрутка PageRank имеют и свои побочные эффекты и риски. А самое главное — временный эффект.

Естественным образом поднять PageRank можно увеличивая значимость страниц сайта для посетителей. Чем полезнее инфорация на сайте, чем более понятно она предоставлена и чем более мотивирован посетитель для того, чтобы поделиться этой информацией, тем чаще страница будет цитироваться и тем больший PR она будет получать и отдавать другим страницам сайта. Сайт будет получать естественный прирост внешней тематической ссылочной массы и естественный рост Page Rank. Особенно полезны в данном случае социальные сети, так как цитируемость страницы в социальных сетях в большим вниманием анализируется Google.

Google PageRank и Yandex тИЦ (RP и CY)

Кроме Google PageRank существуют аналогичные алгоритмы и технологии для определения авторитетности. К примеру, Яндекс использует для определения важности страницы тИЦ, который, в отлиции от PageRank, определяет значимость входящих ссылок, в большей степени, на основании тематической близости сайтов. И этому посвещена отдельная статья — тематический индекс цитирования.

Алгоритм PageRank

Продолжаем описание популярных алгоритмов из серии «Топ-10 data mining алгоритмов» и сегодня весьма интересный случай — алгоритм PageRank.

PageRank – это алгоритм ссылочного ранжирования, разработанный для определения относительной важности объекта, связанного с сетью объектов.

Ссылочное ранжирование? Это тип сетевого анализа, определяющий ассоциации (читай, связи) между объектами.

Вот пример: Наиболее известный пример PageRank – это поисковая система Google. Хотя их поисковик не полностью полагается на PageRank, все же это один из методов, который использует Google, чтобы определить важность веб-страницы.

Веб-страницы в интернете связаны друг с другом. Если datascientist.one дает ссылку на РБК, то РБК получает очко в копилку, так как datascientist.one посчитал сайт РБК релевантным.

Но это еще не всё…

Вес балла от datascientist.one оценивается важностью и релевантностью самого сайта.
Другими словами, любая веб-страница, дающая ссылку на datascientist.one, повышает его релевантность.

Эта концепция голосов и релевантности представляет собой PageRank. Голос datascientist.one за РБК увеличивает PageRank РБК, и величина, на которую он увеличится, зависит от влияния и значимости datascientist.one.

Что означают PageRank равные 0,1,2,3 и так далее? Хотя точное значение числа PageRank компания Google не раскрывает, мы можем получить об этом представление.

Все это выглядит как соревнование по популярности. Мы все имеем представление о том, какие сайты релевантные и популярные. PageRank просто переводит наше представление в цифры.

Как еще применяется PageRank? PageRank был специально разработан для всемирной сети.

По своему содержанию PageRank – это просто суперэффективный способ проведения ссылочного ранжирования. Однако соединяемые объекты необязательно должны быть веб-страницами.

Вот 3 инновационных применения PageRank:

  1. Доктор Стефано Аллесина (Stefano Allesina) из Чикагского университета применил PageRank в сфере экологии, чтобы определить, какие из особей являются жизненно важными для поддержания экосистемы.
  2. Twitter разработал WTF (Who-to-Follow) – персонализированный вариант рекомендательного движка, основанного на PageRank, показывающий список людей, на которых стоит подписаться.
  3. Бин Жэнь (Bin Jiang) из Гонконгского политехнического университета использовал вариант PageRank для предсказания перемещения людей на основании топологических метрик в Лондоне.

Требует ли этот метод обучения или он самообучающийся? PageRank обычно расценивают как самообучающийся метод, поскольку он часто используется для определения релевантности веб-страницы.

Почему именно PageRank? Главным достоинством PageRank является надежность, несмотря на сложность получения релевантной входящей ссылки.

Где он используется? Торговая марка PageRank принадлежит компании Google. Однако алгоритм PageRank запатентован Стэндфордским университетом.

Если у вас возник вопрос по поводу того, можете ли вы использовать PageRank: лучше посоветоваться со знающими людьми, но, вероятно, вы можете использовать алгоритм сколько вам угодно, пока он не начнет приносить вам финансовую выгоду.

Вот 3 примера реализации PageRank:

Пример вычисления pagerank (видео)

Алгоритм PageRank на Python

Вот как выглядит алгоритм ранжирования страниц на Питоне (полные инструкции можно найти по ссылке выше):

Растолкованный PageRank

Этот документ раскрывает мое понимание и точку зрения на алгоритм PageRank в Google, поисковая оптимизация сайта . Для тех, кто не знает меня: я разрабатываю поисковые системы на заказ. Поэтому мне присуще программистское понимание алгоритмов поисковых систем, как они работают, что они могут делать, а что нет. Из-за этого я способен сделать немало выводов о том, как работает PageRank. Я верю, что информация в данном документе настолько точна, насколько возможно. Никто не знает наверняка детали PageRank, исключая саму Google 1. Не стесняйтесь спрашивать о выводах, которые вы не можете понять; с помощью общения мои предположения могут стать более корректными. Пишите, пожалуйста, мне на chris@searchenginesystems.net свои вопросы и комментарии.

Мастер Йода рекомендует:  Фотомонтажим на PHP

Достаточно предисловий, приступим к тому, чему посвящен этот документ — к PageRank!

Что такое PageRank?


PageRank — это метод Google для измерения «важности» страницы. Когда все другие факторы, такие как тэг Title и ключевые слова учтены, Google использует PageRank, чтобы откорректировать результаты так, что более «важные» сайты поднимутся соответственно вверх на странице результатов поиска пользователя.

То есть, порядок ранжирования в Google работает следующим образом:

1. Найти все страницы, соответствующие ключевым словам поиска.

2. Отранжировать соответственно «страничным факторам», таким, как ключевые слова.

3. Учесть текст ссылок на страницы.

4. Откорректировать результаты данными PageRank.

Как определяется PageRank?

Теория Google гласит, что если Страница A ссылается на страницу B, то Страница А считает, что Страница B — важная страница. Текст ссылки не используется в PageRank. PageRank также влияет на важность ссылок на страницу. Если на страницу указывают много важных ссылок, то ее ссылки на другие страницы также становятся более важными.

Насколько важен PageRank?

Значимость каждого отдельного фактора в алгоритмах поисковой системы зависит от качества информации, которое он обеспечивает. Поэтому имеет смысл вначале взглянуть на это качество.

Когда Гугл был лишь крохотным Гугленком в подгузниках, можно было с уверенностью сказать, что ссылка была точным признаком рекомендации. Однако, в настоящее время это больше не так по двум очень важным причинам:

1. Интернет существенно изменился. Ссылка сегодня это, скорее, лишь связанный сайт, лицензионное требование или ответная услуга (как перекрестные ссылки), чем истинная рекомендация 2.

2. Как только вы создадите поисковую машину, которая рассматривает ссылки как рекомендации, люди начнут пытаться воздействовать на ссылки. Как только они станут воздействовать на них, ссылки перестанут быть рекомендациями.

Поэтому надежность информации, обеспечиваемой ссылками, не обязательно хороша, и она постоянно уменьшается. Это является причиной низкой и все время уменьшающейся важности PageRank в алгоритме ранжирования Google.

Тем не менее, у PageRank есть одно реабилитирующие его свойство. На него трудней влиять, чем на любой другой фактор ранжирования. Это означает, что у PageRank есть возможность дать вам преимущество перед конкурентами, когда он использован в комбинации с другими приемами оптимизации для поисковых машин. Однако, я предупреждаю вас: тут нет коротких путей. Для эффективного использования PageRank вам нужно будет понять его полностью, иначе есть шансы, что вы будете тратить ваше время зря.

PageRank

PageRank — алгоритм анализа ссылок, названный в честь Ларри Пейджа и используемый в поисковой машине Google [1] . Алгоритм присваивает числовое значение каждому элементу множества документов, связанных гиперссылками. Присвоенное числовое значение означает «важность» одного документа по отношению к другим элементам множества.

Содержание

Применение

Алгоритм PageRank применяется в информационном поиске в задаче ранжирования документов.

Алгоритм

Здесь представлено описание приближённого вычисления значения PageRank для вершин заданного ориентированного невзвешенного графа.

Сложность и время работы

Время работы алгоритма PageRank оценивается как O ( | V | + | E | ) <\displaystyle O(|V| + |E|)>.

Растолкованный PageRank, часть 3. Пример расчета

Прошлый раз мы вплотную подошли к попытке расчета PageRank, а, точнее, его упрощенной версии — Minirank.

Вначале мы не знаем, какие веса MiniRank у этих страниц, поэтому мы
их просто присвоим. Для простоты, мы выберем число один. В результате
диаграмма становится…

Все еще легко! Сейчас вспомните правила передачи веса. Вначале мы
применяем коэффициент затухания. (Коэффициент затухания, в основном,
говорит о том, что страница не может голосовать так, чтобы другая
страница была столь же важна, как она сама. Это означает, что страницы,
к которым труднее добраться в Web, менее важны.) Затем мы делим
сохранившийся вес на число ссылок. Мы подсчитываем итоговый вес,
который должен быть добавлен ко всем до единой страницам, перед тем как
мы окончательно его прибавим 8 .

Итак, глядя вначале на страницу A, видим, что значение веса
MiniRank, доступное для передачи, после затухания равно 1 *
0,85 = 0,85. Со страницы ведут две ссылки, поэтому, по окончании
итерации, мы добавим 0,425 к весу MiniRank страницы B и 0,425 к
весу MiniRank страницы C. Мы не можем сделать это до тех пор, пока
мы не рассчитали все ссылки страницы, потому что это повлияет на
результаты.

Перейдем к странице B. Она содержит только одну ссылку.
Поэтому, она передаст 1 * 0,85 = 0,85 странице C, когда
мы сделаем все вычисления для ссылок.

Страница C также имеет одну ссылку. Поэтому она передаст вес 1 * 0,85 = 0,85 странице A.

Страница D имеет одну ссылку, поэтому она передает 0,85 странице C.

Сейчас мы можем добавить все суммы ко всем весам страниц.

Новые значения весов MiniRank показывают, сколь важна страница C. Но мы еще не завершили. Поскольку все страницы начали с одного значения, по правде говоря, мы вычислили только популярность в ссылках (link popularity). Суть PageRank и MiniRank такова, что страницам, на которые чаще ссылаются, следует получить больше голосов; поэтому мы должны проделать то же самое еще раз! На этот раз страница C имеет большее влияние, потому что ее текущий вес MiniRank выше.

Так, посмотрим на страницу A вначале. Ее текущий вес MiniRank равен 1,85. Величина MiniRank, доступная для передачи, после применения затухания составляет 1,85 * 0,85 = 1,5725. Есть две ссылки со страницы, поэтому по завершению итерации мы добавим 0,78625 к весу MiniRank страницы B и весу MiniRank страницы C.

Перейдем к странице B. У нее есть только одна ссылка. Следовательно, она передаст 1,425 * 0,85 = 1,21125 странице C, когда мы завершим все вычисления со ссылками.

Страница C также имеет одну ссылку, но при этом обладает
огромным весом 3,125 MiniRank. Поэтому она передаст 3,125 *
0,85 = 2,65625 странице A.

Страница D имеет одну ссылку, поэтому она передает 0,85 странице C.

Мы уже можем видеть то, что следовало ожидать: страница C имеет
наибольший вес MiniRank, страница A — следующий по величине.
На практике нам нужно было бы повторить эти действия от 50 до
100 раз, чтобы гарантировать, что низкая точность предыдущих
итераций сведена на нет. Просто!

Обратная связь PageRank

Но подождите минутку! Что-то происходит между страницами A и C, поэтому взглянем еще раз.

Во время одной итерации вычислений страница C дает
странице A повышение в весе MiniRank (PageRank). Во время
следующей итерации она сама получает увеличение веса, пропорциональное
новому улучшившемуся весу MiniRank страницы A (она получает назад
часть своего веса MiniRank!).

Это обратная связь PageRank. Можно подумать, что Google обязан
игнорировать ссылки такого рода, особенно, если страница A и
страница C расположены на одном сайте. Действительно, я слышал
мнение нескольких человек, которые считают, что Google обязан. Истина в
том, что Google не может сделать это. Представьте проделывание
вычислений над миллионами страниц вместо четырех… представьте только
как вам определять, когда встречается обратная связь, и как избавляться
от нее. И даже если вы справитесь, как вы сведете на нет влияние,
которое это окажет на оставшуюся часть системы? Обратная связь
PageRank — неотъемлемая часть системы! Фактически, она нужна для
правильного функционирования PageRank и является частью алгоритма.

8 Одно из
основных отличий демонстрационного MiniRank от настоящего PageRank в
том, что вычисленный на новой итерации вес добавляется к весу страницы,
полученному во время предыдущей итерации, в то время как в PageRank
новый вес заменяют старый. Еще одно отличие — в MiniRank к новому
весу не прибавляется (1-d). Из-за этого эффект «обратной связи»,
столь привлекательный в примерах с MiniRank, на практике (где
используется PageRank) во многих случаях может иметь заметно меньшее
значение. [Прим. А. С.]

Что такое PageRank

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.

Введение

Понятие Google PageRank является одним из ключевых моментов в работе поисковой машины Google. Наряду с другими параметрами, влияющими на выдачу (сортировку) сайтов в результатах поиска, знание модели PageRank необходимо как для понимания процесса поиска, так и для использования оптимизаторами при продвижении своих сайтов в поисковой системе.

Истории появления этого параметра будет посвящена другая статья. Здесь я, как автор, хочу лишь изложить математические основы вычисления PageRank, используемые повсеместно. Для начала, примем за аксиому, что при расчете Google PR, не будет учитываться “рассовая” принадлежность ссылок, их “языковая группа” или “внешний вид”, а будем полагать, что все страницы в сети Интернет равны (как мы с вами), и вес ее будет определяться лишь весом ссылающихся страниц-доноров.

Представьте себе, что вы Учитель (или свою профессию – сапожник, программист, оптимизатор, доктор с пиявками …), и что вам надо делать свою работу. Перед вами стоит задача: как найти тех людей, которым вы нужны, и которые будут рады воспользоваться вашими услугами?! Для этого можно либо сделать себе рекламу (баннеры, adsense, директ и др.), либо устроиться в какую-нибудь контору, которая будет поставлять вам клиентов (фриленсерские сайты, статьи, социальные закладки). Единственное, когда клиенты сами будут к вам приходить, это если другие скажут им о вас, посоветуют, расхвалят и т.д. Здесь вы не тратите средства на рекламу, и это самые эффективные клиенты, которым действительно нужна ваша помощь.

Говоря другими словами, мы подошли к понятию PageRank, который отражает вес вашей страницы по ссылкам (“слухам”) с других страниц. И понятно, что чем больше ссылающихся на вас страниц, тем больше у вас вес.

Определение PageRank

PageRank (далее просто PR) это числовая величина — мера “важности” страницы в поисковой системе Google. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами от количества и качества ссылающихся страниц. А если говорить математическим языком, то PR это алгоритм расчёта авторитетности страницы, используемый поисковой системой Google. PR не является основным, но является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска.

Мастер Йода рекомендует:  Нативные «пуши» на macOS, безголовый Chromium и Material Design Google выпустила Chrome 59

Следует отметить, что при расчете PR Google учитывает не все ссылки, а отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта (такой эффект назвается поисковой пессимизацией).


Классическая модель представления PageRank

Документ (на англ. языке), подробно описывающий модель PageRank, введеной Сергеем Брином и Ларри Пейджем, можно скачать по ссылке: The_PageRank_Citation_Ranking.pdf [299.73KB].

Основная формула, описывающая PR выглядит следующим образом.

где dдемпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);
nколичество страниц, ссылающихся на страницу-акцептор (на которые не наложен фильтр);
Ti — i-ая ссылающаяся страница;
Cколичество внешних ссылок на странице-доноре.

Тулбарное представление PageRank

Поскольку ссылающихся страниц может быть много, и общее количество страниц в поисковой системе Google достаточно велико (около десятка биллионов штук) а также их количество постоянно растет, то представлять вес страницы в абсолютных значениях для вебмастеров было бы весьма неправильно. Для этого ввели понятие TLPRToolBar PageRank, который имеет значение от 0 до 10 (зелененькая шкала в Google Toolbar).

Для того, чтобы уложить все веса страниц между значениями от 0 до 10 используют логарифмическую шкалу.

TLPR = Logbase(PR) * a

где base — основание логарифма, которое зависит от количества страниц в поисковой машине (возможно и от ряда других факторов). Некоторые принимают его равным 7;
a — некий коэффициент приведения, который удовлетворяет неравенству 0 TLPR означает нулевой реальный PageRank. По первой формуле видно, что даже при n = 0, мы получим минимальный PRmin = (1-d) = 0.15. Это значение соответствует TLPR ≈ -1. При таких (отрицательных) значениях тулбарного PR считается что PR = N/A (или еще не определен), однако он также оказывает влияние на распределение веса между ссылками-акцепторами. Также следует заметить, что тулбарное значение предназначено только для отображения вебмастерам в Google Toolbar и никак не влияет на выдачу в серпе. На выдачу в серпе влияние оказывает реальный PR страницы!

Выводы

Исходя из принципов расчета Google PageRank, можно теперь легко расчитать, с каких ссылок нужно ссылаться и сколько нужно ссылок, чтобы получить тот или иной PR. Также можно прогнозировать PR. Один из важных выводов, который я для себя сделал заключается в следующем. Если мы имеем новый сайт со страницами более 10,000 (число страниц зависит от количества ссылок с них на другие страницы), они правильно перелинкованы и каждая ссылается на главную страницу, то главная страница получит хороший вес от этих ссылок. Вот немного математики по этому поводу.

PRmin = 0.15;
PR = 0.15 + 0.85 * 20000/10; (при учете в среднем 10 ссылок на странице)
TL*PR* = Log(1700.15, 7) = 3.823 ≈ 4

Вот вам и пример хорошего PR без единой внешней ссылки с других сайтов ��
Теперь понятно, почему у таких систем как Digg.com, Del.icio.us и других подобных весьма большой PageRank.

На вышеизложенной теории построен JavaScript калькулятор для расчета PR (правда без учета ссылок с PR0). Калькулятор можно разместить на своем сайте. Код прилагается.

Часто задаваемые вопросы

Как повысить PR моего сайта?

Существует множество способов повышения веса своих страниц, но главная идея — это качественные ссылки с других сайтов. Для этого можно использовать каталоги, социальные закладки, статьи, форумы, блоги и другие типы сайтов. Однако не следует глупо расставлять множество ссылок на других сайтах, так как помимо PageRank существует множество других ранков, влияющих на выдачу страницв в результатах поиска (например TrustRunk).

Бывает ли отрицательный PR?

Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.

Нужно ли ставить ссылки на своем сайте и как это влияет на PR моей страницы?

Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок.

Когда происходят апдейты PageRank?

Апдейты для тулбарного PR происходят раз в 2-4 месяца, для реального PR я уверен, что апдейты происходят чаще. В Google каталоге Dmoz можно посмотреть TLPR на текущий момент для вашего сайта, если он размещен в каталоге.

Влияет ли язык ссылки на PR?

Ни коим образом язык на передачу веса PR не влияет. Влияет только качество и количество ссылающихся на вас страниц.

Влияет ли посещаемость сайта на Google PageRank?

Нет, не влияет. На значение PageRank влияет только количество и качество ссылающихся ресурсов.

Перетекает ли PR с картинок?

С картинок PageRank “перетекает”, только если они являются ссылками, по которым пользователь может перейти на другой ресурс.

Растолкованный PageRank

Введение

Этот документ раскрывает мое понимание и точку зрения на алгоритм PageRank в Google. Для тех, кто не знает меня: я разрабатываю поисковые системы на заказ. Поэтому мне присуще программистское понимание алгоритмов поисковых систем, как они работают, что они могут делать, а что нет. Из-за этого я способен сделать немало выводов о том, как работает PageRank. Я верю, что информация в данном документе настолько точна, насколько возможно. Никто не знает наверняка детали PageRank, исключая саму Google 1 . Не стесняйтесь спрашивать о выводах, которые вы не можете понять; с помощью общения мои предположения могут стать более корректными. Пишите, пожалуйста, мне на chris@searchenginesystems.net свои вопросы и комментарии.
Достаточно предисловий, приступим к тому, чему посвящен этот документ — к PageRank!

Что такое PageRank?

PageRank — это метод Google для измерения «важности» страницы. Когда все другие факторы, такие как тэг Title и ключевые слова учтены, Google использует PageRank, чтобы откорректировать результаты так, что более «важные» сайты поднимутся соответственно вверх на странице результатов поиска пользователя.

То есть, порядок ранжирования в Google работает следующим образом:

  1. Найти все страницы, соответствующие ключевым словам поиска.
  2. Отранжировать соответственно «страничным факторам», таким, как ключевые слова.
  3. Учесть текст ссылок на страницы.
  4. Откорректировать результаты данными PageRank.

Как определяется PageRank?

Теория Google гласит, что если Страница A ссылается на страницу B, то Страница А считает, что Страница B — важная страница. Текст ссылки не используется в PageRank. PageRank также влияет на важность ссылок на страницу. Если на страницу указывают много важных ссылок, то ее ссылки на другие страницы также становятся более важными.

Насколько важен PageRank?

Значимость каждого отдельного фактора в алгоритмах поисковой системы зависит от качества информации, которое он обеспечивает. Поэтому имеет смысл вначале взглянуть на это качество.

Когда Гугл был лишь крохотным Гугленком в подгузниках, можно было с уверенностью сказать, что ссылка была точным признаком рекомендации. Однако, в настоящее время это больше не так по двум очень важным причинам:

  1. Интернет существенно изменился. Ссылка сегодня это, скорее, лишь связанный сайт, лицензионное требование или ответная услуга (как перекрестные ссылки), чем истинная рекомендация 2 .
  2. Как только вы создадите поисковую машину, которая рассматривает ссылки как рекомендации, люди начнут пытаться воздействовать на ссылки. Как только они станут воздействовать на них, ссылки перестанут быть рекомендациями.

Поэтому надежность информации, обеспечиваемой ссылками, не обязательно хороша, и она постоянно уменьшается. Это является причиной низкой и все время уменьшающейся важности PageRank в алгоритме ранжирования Google.

Тем не менее, у PageRank есть одно реабилитирующие его свойство. На него трудней влиять, чем на любой другой фактор ранжирования. Это означает, что у PageRank есть возможность дать вам преимущество перед конкурентами, когда он использован в комбинации с другими приемами оптимизации для поисковых машин. Однако, я предупреждаю вас: тут нет коротких путей. Для эффективного использования PageRank вам нужно будет понять его полностью, иначе есть шансы, что вы будете тратить ваше время зря.

Основные факты о PageRank

Для понимания оставшейся части этого документа, вам нужно знать несколько фактов о PageRank.

  1. PageRank — это число 3 , характеризующее исключительно голосующую способность 4 всех входящих ссылок на страницу и то, как сильно они рекомендуют эту страницу.
  2. Каждая уникальная страница сайта, проиндексированная Google, имеет вес PageRank. Люди часто ошибаются, думая о весе сайта, который на самом деле является весом главной страницы этого сайта 5 .
  3. Внутренние ссылки сайта учитываются при расчете веса PageRank для других страниц сайта.
  4. PageRank независим, он не принимает во внимание текст ссылок и т. д. Конечно, они связаны, но говорить, что это одно и то же, это все равно что говорить, будто тэг Title то же самое, что ключевые слова в тексте.

1 Детали реализации действительно скрыты, но сам алгоритм PageRank не является секретом и прекрасно описан в статьях «The PageRank Citation Ranking: Bringing Order to the Web», а также «The Anatomy of a Large-Scale Hypertextual Web Search Engine», написанных создателями Google — Сергеем Брином и Лоренсом Пэйджем (какая подходящая фамилия!) [Прим. А. С.]

2 Крис не упомянул партнерские программы магазинов, а также широко распространенные в русскоязычном интернете баннерные сети и счетчики, сайты которых за счет обратных ссылок могут «незаслуженно» иметь большой вес. [Прим. А. С.]

3 Крис употребляет термин «PageRank» в двух разных смыслах. Первый — это алгоритм PageRank. Второй — это собственно вес страницы, вычисленный на основании данного алгоритма. Это связано с тем, что «page rank» означает «ранг страницы», то есть вес, и в английском тексте нет смысла повторять слово дважды. Но в русском переводе это не очевидно, поэтому, чтобы избежать путаницы, в дальнейшем, где это будет необходимо, во втором смысле будет использоваться термин «вес страницы» или «вес PageRank». [Прим. А. С.]

4 Автор подразумевает, что каждая страница, ссылаясь на другую страницу, «голосует» за нее. Голосующая способность тем больше, чем больше вес PageRank у ссылающейся страницы. [Прим. А. С.]

Добавить комментарий