Язык веб-статистики

Оглавление (нажмите, чтобы открыть):

Выбираем язык для веб-разработки

С конкретными языками в этом плане проще — обычно базовых знаний уже достаточно для оценки, поэтому сменить направление деятельности можно быстро и без больших потерь времени. Однако именно выбор языка приводит юные умы в ступор: ведь их куда больше, чем общих направлений программирования, а браться за что-то надо.

Спокойствие, сейчас коллективный разум сделает выбор за вас.

В первой части поговорим о языках веб-пространства. Какой предъязыковой расклад надо знать и каков порядок изучения? Об этом далее.

Передовая, тыл и неочевидный выбор

Первый выбор, который надо сделать — сфера ответственности.

Front-end разработчики
Иногда их еще называют веб-дизайнерами, но это неправильно. Задача front-end разработчика сводится к созданию интерфейса, он отвечает за то, чтобы веб-страница загружалась быстро, не тормозила и код на ней работал правильно.

Backend-разработчики
Люди, ответственные за скрытую от глаз функциональность и обработку данных. Их работа — написание серверного кода.

Full-stack специалисты
Они востребованы наибольшим образом просто потому, что способны в одиночку выполнить все пожелания заказчика.

Конечно, проще всего поставить себе задачу разобраться со всем, но это лишь рассеет ваше внимание на ранних этапах, а на более поздних вы и так познаете необходимость хотя бы поверхностного изучения всех процессов. Поэтому пойдём по порядку и начнём с front-end.

Лицо, которое надо продать

Самое главное, что не надо делать человеку, желающему стать front-end разработчиком, так это искать минимальный список предъявляемый список требований к специалисту. В этом случае велик риск наткнуться на статьи, подобные статье «Frontend-разработчики должны быть в теме всего». Всё что там написано — абсолютная правда, но прийти к этому надо начиная с малого, а малое — это 3 основных кита frontend-а: HTML, CSS и JavaScript. Базу для дальнейшнего обучения вы можете получить на бесплатном интенсиве по веб-разработке.

Ещё несколько лет назад, изучив HTML и CSS в формате нескольких умных книг, а JS на уровне jQuery, можно было всерьёз претендовать на позицию junior-a. Однако сегодня времена изменились, а требования сильно возросли. Впрочем, знания HTML и CSS по-прежнему можно уложить в пару хороших книг:

На JavaScript придётся потратить достаточно много времени. Здесь мало будет изучить теорию, например по книге «JavaScript: Сильные стороны». Необходимо несколько месяцев набивать руки и тренировать мозги на практике, в том числе используя упомянутый jQuery.

Кроме теоретических и практических знаний, front-end специалист должен очень хорошо знать последние интернет-тенденции и уметь профессионально их применять. Ведь это именно та зона ответственности, по которой подавляющее большинство заказчиков будет оценивать весь проект на момент сдачи.

Обработать, прикрутить и создать

Базовый язык для любого back-end разработчика — PHP. Это некоторая основа, знать которую в совершенстве, как и делать основным инструментом, совсем не обязательно, но на базовом уровне понимать обязаны. Для этого можно хотя бы внимательно изучить книгу «PHP: правильный путь».

Что касается актуальных языков, то выбирать скорее всего придётся из Ruby и Python, причём выбор этот — чистая вкусовщина. Даже здесь на форуме периодически вспыхивают споры, но даже в споре за удобство изучения однозначного победителя найти невозможно. По Python полезно будет прочитать книгу с незамысловатым названием «Изучаем Python», по Ruby — «Rails 4. Гибкая разработка веб-приложений».

Ещё один язык из разряда must know — всё тот же JavaScript с его производными jQuery и Ajax. В данном случае интересует именно back-end разработка, поэтому тратить время на общее изучение языка не имеет смысла, а вот посещение ресурсов вроде блога Антона Шевчука может оказаться крайне полезным.

Ну и конечно потребуются знания в области баз данных. Как минимум, это означает изучение SQL, как максимум — опыт работы с популярными БД.

Один за всех

Правда профессии веб-разработчика в том, что так называемых «сферических» специалистов здесь практически нет, да и рядовые заказчики далеко не всегда понимают эти деления, поэтому в том или ином виде к full-stack-у придётся прийти довольно быстро. Соответственно перечитайте предыдущие 2 раздела, посетите ещё раз форум GeekBrains и начинайте грызть гранит программной науки.

Знания не о языках

Помимо самих языков, необходимо изучать все прилагающиеся к ним профильные надстройки. Особенно это касается JavaScript (AngularJS, Knockout, Backbone) и CSS (Bootstrap, Foundation). Кроме того вам необходимо набить руку с системами контроля версий Git и SVN.

Для того, чтобы добиться больших успехов в веб-разработке — запаситесь терпением, двигайтесь шаг за шагом к своей цели, выбирая ту дорожку, которая представляется вам максимально интересной. И совсем не важно, если она отличается от описанной выше или в какой-то другой статье. Любите то, что делаете, посвящайте этому время, вкладывайте душу, и успех не заставит себя ждать.

Самый мучительный выбор для тех, кто хочет попасть в мир программирования — выбрать свою область. Мучителен он потому, что проснувшись однажды и поняв, что это не ваше призвание, а не просто лень продолжать, вы потеряете месяцы и годы обучения и практики.

С конкретными языками в этом плане проще — обычно базовых знаний уже достаточно для оценки, поэтому сменить направление деятельности можно быстро и без больших потерь времени. Однако именно выбор языка приводит юные умы в ступор: ведь их куда больше, чем общих направлений программирования, а браться за что-то надо.

Спокойствие, сейчас коллективный разум сделает выбор за вас.

В первой части поговорим о языках веб-пространства. Какой предъязыковой расклад надо знать и каков порядок изучения? Об этом далее.

Передовая, тыл и неочевидный выбор

Первый выбор, который надо сделать — сфера ответственности.

Front-end разработчики
Иногда их еще называют веб-дизайнерами, но это неправильно. Задача front-end разработчика сводится к созданию интерфейса, он отвечает за то, чтобы веб-страница загружалась быстро, не тормозила и код на ней работал правильно.

Backend-разработчики
Люди, ответственные за скрытую от глаз функциональность и обработку данных. Их работа — написание серверного кода.

Full-stack специалисты
Они востребованы наибольшим образом просто потому, что способны в одиночку выполнить все пожелания заказчика.

Конечно, проще всего поставить себе задачу разобраться со всем, но это лишь рассеет ваше внимание на ранних этапах, а на более поздних вы и так познаете необходимость хотя бы поверхностного изучения всех процессов. Поэтому пойдём по порядку и начнём с front-end.

Лицо, которое надо продать

Самое главное, что не надо делать человеку, желающему стать front-end разработчиком, так это искать минимальный список предъявляемый список требований к специалисту. В этом случае велик риск наткнуться на статьи, подобные статье «Frontend-разработчики должны быть в теме всего». Всё что там написано — абсолютная правда, но прийти к этому надо начиная с малого, а малое — это 3 основных кита frontend-а: HTML, CSS и JavaScript. Базу для дальнейшнего обучения вы можете получить на бесплатном интенсиве по веб-разработке.

Ещё несколько лет назад, изучив HTML и CSS в формате нескольких умных книг, а JS на уровне jQuery, можно было всерьёз претендовать на позицию junior-a. Однако сегодня времена изменились, а требования сильно возросли. Впрочем, знания HTML и CSS по-прежнему можно уложить в пару хороших книг:

На JavaScript придётся потратить достаточно много времени. Здесь мало будет изучить теорию, например по книге «JavaScript: Сильные стороны». Необходимо несколько месяцев набивать руки и тренировать мозги на практике, в том числе используя упомянутый jQuery.

Кроме теоретических и практических знаний, front-end специалист должен очень хорошо знать последние интернет-тенденции и уметь профессионально их применять. Ведь это именно та зона ответственности, по которой подавляющее большинство заказчиков будет оценивать весь проект на момент сдачи.

Обработать, прикрутить и создать

Базовый язык для любого back-end разработчика — PHP. Это некоторая основа, знать которую в совершенстве, как и делать основным инструментом, совсем не обязательно, но на базовом уровне понимать обязаны. Для этого можно хотя бы внимательно изучить книгу «PHP: правильный путь».

Что касается актуальных языков, то выбирать скорее всего придётся из Ruby и Python, причём выбор этот — чистая вкусовщина. Даже здесь на форуме периодически вспыхивают споры, но даже в споре за удобство изучения однозначного победителя найти невозможно. По Python полезно будет прочитать книгу с незамысловатым названием «Изучаем Python», по Ruby — «Rails 4. Гибкая разработка веб-приложений».

Ещё один язык из разряда must know — всё тот же JavaScript с его производными jQuery и Ajax. В данном случае интересует именно back-end разработка, поэтому тратить время на общее изучение языка не имеет смысла, а вот посещение ресурсов вроде блога Антона Шевчука может оказаться крайне полезным.

Ну и конечно потребуются знания в области баз данных. Как минимум, это означает изучение SQL, как максимум — опыт работы с популярными БД.

Один за всех

Правда профессии веб-разработчика в том, что так называемых «сферических» специалистов здесь практически нет, да и рядовые заказчики далеко не всегда понимают эти деления, поэтому в том или ином виде к full-stack-у придётся прийти довольно быстро. Соответственно перечитайте предыдущие 2 раздела, посетите ещё раз форум GeekBrains и начинайте грызть гранит программной науки.

Знания не о языках

Помимо самих языков, необходимо изучать все прилагающиеся к ним профильные надстройки. Особенно это касается JavaScript (AngularJS, Knockout, Backbone) и CSS (Bootstrap, Foundation). Кроме того вам необходимо набить руку с системами контроля версий Git и SVN.

Для того, чтобы добиться больших успехов в веб-разработке — запаситесь терпением, двигайтесь шаг за шагом к своей цели, выбирая ту дорожку, которая представляется вам максимально интересной. И совсем не важно, если она отличается от описанной выше или в какой-то другой статье. Любите то, что делаете, посвящайте этому время, вкладывайте душу, и успех не заставит себя ждать.

Языки программирования и технологии для веб-разработки

Карьера в области веб-разработки является прибыльной, захватывающей и требующей готовности к постоянным изменениям. Для этого требуется определенный набор хорошо отработанных навыков и знание языков, которые вам нужно будет обновлять год за годом. В свою очередь, каждый день Вы сможете создавать действительно классные веб-материалы, и в конце каждого месяца вы будете получать хорошую зарплату. Неплохо, да?

В последние годы, когда сеть продолжает развиваться, появилось несколько различных потоков веб-разработки:

  • Backend (или веб-разработка на стороне сервера) охватывает все те вещи, которые работают в фоновом режиме, чтобы создавать веб-сайты или веб-приложения, например базы данных и скрипты.
  • Frontend (также известная как веб-разработка на стороне клиента) касается части веб-интерфейса, с которой пользователь взаимодействует — часть, с которой знакомы все, кто пользуется Интернетом.
  • Есть Fullstack разработчики, которые могут сделать все вышеперечисленное.

Независимо от того, какой путь вы выбрали, вы все равно должны понимать каждую сторону, чтобы правильно выполнять свою работу.

Итак, вот 10 лучших языков программирования для веб-разработки, как на стороне клиента, так и на стороне сервера.

CSS / HTML

Рука об руку с JavaScript идут CSS и HTML — вместе они составляют святую троицу разработки веб-интерфейса. HTML (Hyper Text Mark Up Language) — это язык веб-браузеров — с помощью которых сделаны сайты. Вы можете пройти курс HTML бесплатно на нашем сайте. CSS (каскадные таблицы стилей) заставляет их выглядеть стильно и со вкусом — гораздо лучше, чем те ужасные сайты, действующие с первых дней работы в Интернете. Для разработчиков веб-интерфейсов очень важно знать эти инструменты от и до. Они также окажутся полезными для backend разработчиков: вы сможете понять, как изменения вашей серверной части влияют на конечного пользователя.

PHP — это скриптовый язык, используемый для быстрого создания динамических веб-страниц. Отличный выбор для frontend и backend разработчиков, чтобы добавить их в арсенал (но особенно для последних), он стоит за такими веб-гигантами, как WordPress и Facebook. PHP позволяет быстро и легко расширять веб-приложения и запускать веб-сайты с повторяющимися серверными задачами (например, обновлять новостные ленты). Он имеет открытый исходный код и очень популярен в среде начинающих компаний, медиа-агентств и электронной коммерции — таких людей, которые часто нанимают новых веб-разработчиков. А ещё, это любимый язык программирования автора этого блога, и да, у нас вы можете изучить PHP бесплатно!

Для full stack разработчиков и на стороне сервера SQL (Structured Query Language) — это вишня на торте вашего разрабатываемого инструментария. SQL является важной частью веб-разработки, что позволяет получать конкретные данные из больших, сложных баз данных. Он пользуется большим спросом среди крупных компаний, таких как Microsoft, поэтому это умный выбор для любого разработчика с высокими амбициями или необходимость, если вы работаете с базами данных на регулярной основе. На нашем сайте вы также можете найти бесплатный курс MySQL для начинающих.

JavaScript

Язык интерфейса, используемый для создания и разработки веб-сайтов, настольных приложений и игр. JavaScript работает во всех браузерах и может работать с программами, которые не размещены в Интернете. Он поддерживает как функциональные, так и объектно-ориентированные стили программирования, и в основном, это ваш подход к созданию потрясающих пользовательских интерфейсов и веб-сайтов / приложений / игр, которые выглядят супер круто. Понимание JavaScript важно, даже если ваше сердце настроено на развитие серверной части. Компоненты, структуры данных и алгоритмы JavaScript применяются практически к любому другому языку.

Python

Новый парень на блоке по сравнению с некоторыми другими языками в этом списке. Python чрезвычайно прост в освоении и является динамичным, универсальным языком. Хотя он более популярен как язык на заднем плане, с ним можно делать практически все, что вы хотите. Разработанный с целью быть читабельным, простым и, самое главное, забавным, это новый фаворит разработчиков во всех областях индустрии. Python является основным языком для начинающих. Он гибкий и чрезвычайно мощный, а главное — имеет очень светлое будущее.

Go — специальный язык программирования Google. Новичок на сцене программирования, который может похвастаться отличной интеграцией, хорошей читабельностью и простотой использования, а также возможностью решения множества проблем, с которыми друг языки не справляются. По мере появления новинок этот — очень перспективный. Кроме того, мы все знаем, что Google является королем Интернета на сегодняшний день, и именно он платит за создание веб-приложений за языке Go.

Java, разработанная в 1990-х годах и по-прежнему наиболее востребованная, является золотым стандартом в области веб-разработки во всем мире, во всех областях. Она ориентирована на объекты и работает на любой платформе, что делает ее чрезвычайно универсальной. Если вы хотите, чтобы ваш safe можно было использовать практически во всех технологических компаниях в мире, то непременно выбирайте Java. Интересный факт: Java изначально предназначался для интерактивного телевидения, но вскоре его создатели поняли, что она слишком далеко опережает свое время для этой конкретной отрасли. Остальное уже история.

Масштабируемая, простая и сверхбыстрая, Ruby и Ruby on Rails — это дуэт мечты, который предлагает язык full stack, а также рамки для быстрого создания полных программ. Любимый среди предпринимателей и начинающих, Ruby имеет широкий выбор сторонних «драгоценных камней» (надстроек), которые могут заставить его делать практически все, что вам нужно. Twitter и Basecamp используют Ruby — неплохой показатель, не так ли?

Главная цель, правильно поставленная и действующая с 1979 года, C ++ — объектно-ориентированный, очень технический язык. Чрезвычайно мощный и с обширными библиотеками, это один из краеугольных языков backend развития. С++ особенно полезен для высокопроизводительных программ и программ с большим количеством шаблонов. Если вы уже знаете C (или если вы изучили C ++ и хотите повернуть свою голову на C), вы уже находитесь на правильном пути.

Подобно C++, C — старый школьный язык, легко скомпилированный. Это часто используемая платформа программирования, которая предлагает элементы построения для других языков, таких как C ++, Python и Java. Фактически, многие из этих языков основаны на C. Отличный вариант для full stack и тех, кто хочет добавить новое измерение в свой набор навыков (или метафорическое силовое упражнение в свою панель инструментов программирования). Он лучше всего подходит для написания системного программного обеспечения и приложений, гарантируя удобный язык для разработчиков, на котором все привыкли работать.

Язык веб-статистики

Кри (языки) — У этого термина существуют и другие значения, см. Кри. Кри Самоназвание: ᓀᐦᐃᔭᐍᐏᐣ Nēhiyawēwin, Nīhithawīwin, Nēhinawēwin Страны … Википедия

Интернет — (англ. Internet, МФА: [ˈɪn.tə.net][1]) всемирная система объединённых компьютерных сетей, построенная на базе IP и маршрутизации IP пакетов. Интернет образует глобальное информационное пространство, служит физической основой для… … Википедия

Кумзари — … Википедия

Список наиболее распространённых языков — По разным подсчётам в мире насчитывается до 7000 языков, однако лишь несколько десятков из них имеют мировое значение или используются официально. Ниже приведна таблица основных мировых языков, основываясь на данных по количесву носителей,… … Википедия

Всемирная молодёжная организация эсперантистов — Участники IJK 2008 в Сомбатхее, Венгрия Всемирная молодёжная организация эсперантистов[1], TEJO (эспер … Википедия

Чувашский алфавит — (чуваш. чӑваш алфавичӗ) общее название алфавитов, буквы которых использовались для передачи элементов звуковой речи в письменности древнечувашского и современного чувашского языка. В чувашской письменности использовались только алфавитные… … Википедия

Чувашская письменность — Содержание 1 Рунический алфавит 1.1 История 1.2 Письменнос … Википедия

Урду — Самоназвание: اردو, Urdu Страны: Индия, Пакистан … Википедия

Чувашский язык — Самоназвание: Чӑваш чӗлхи Страны: Россия … Википедия

5 дней в августе — 5 Days of August / 5 Days of War … Википедия

Программисты, учите статистику или я вас поубиваю!

Есть вещь, которая бесит меня больше всего. Всегда раздражают рассказы программистов, которые на словах специалисты в области статистики, а на деле ничего не понимают. Я изучаю эту науку много лет и до сих пор думаю, что ничего не знаю. Эта статья — мой призыв всем кто занимается написанием программ, хорошо изучить статистику, для того чтобы понять, как мало они знают. Мне непонятно, чем обоснована такая уверенность в своих ограниченных знаниях, превосходит которую только неуверенность в себе.

Для начала, немного о себе. Я заинтересовался статистикой тогда, когда начал изучать историю математики и то, как радикально изменила статистика способы изучения окружающего нас мира. До появления статистики как науки, существовало убеждение, что мир прекрасно описывается математическими моделями и любая найденная погрешность объяснялась отсутствием соответствующей математической модели. Спасибо Декарту, который развеял этот миф и доказал, что математика не может объяснить все. Со временем, все основные науки переняли эмпирический взгляд на мир. Кроме информатики, конечно.

Я обучался информатике весьма странным образом — больше изучал социологию, бизнес, экономику и историю нежели компьютерные науки. Я посещал несколько математических курсов, изучал статистику в университете, изучал язык программирования R и прочел уйму литературы по этой теме. Однако это ничуть не прибавило мне уверенности в том, что я до конца понимаю столь широкую тему. Единственное, что я могу, это применять статистические методы для решения общих задач, с которыми я сталкиваюсь в работе. Я обожаю решать задачи измерения и настройки производительности при помощи аппарата статистики.

Вопросы измерения производительности часто становятся причиной споров, поскольку ни у кого из моих коллег нет доказательств своей правоты. Я предложу свой способ измерения, а они смеются над этим. Я пробую показать, как правильно строить временную диаграмму, а это выводит их из себя. Я ставлю под сомнение их вычисления, а коллеги пытаются привести неубедительные, с точки зрения статистики, доказательства. Я не могу их винить, поскольку, скорее всего, так их научили в университете, что логика и причинно-следственная связь более значимы, чем наблюдение и доказательства. Даже великий Кнут однажды сказал:

В приведенном выше коде возможны ошибки, я только доказал, что он верен, но не запускал его.

Слепой на планете, где никто не видит

Думаю, вы все об этом думали в какой-то момент. «Представьте, что вы на планете, где все слепы, а вы — единственный зрячий. Как вы опишите закат?» Обычно это дается в качестве обычного скучного упражнения в университете. А вот если бы эта планета была бы населена программистами, это было бы действительно интересно.

Зед: Ух ты, здесь прекрасный синий закат.

Джо: Закат красный.

Зед: Он синий. Я же зрячий, забыл?

Фрэнк: Ага, но он красный. Ты идиот. Я слышу, как закат заставляет воздух двигаться, и я знаю, что он красный.

Зед: Пойми же ты, я единственный, кто видит! Он синий.

Джо: Я писал огромные веб-приложения на всех языках программирования и даже программировал на языке VAX. Я знаю, что закат красный.

Фрэнк: Он красный из-за тепла, которое ощущает моя рука. Я уверен в этом.

Зед: Вы не правы.

Джо: Это ты не прав.

Фрэнк: Не убедил.

Вот как я себя чувствую, когда пытаюсь объяснить ошибки в чьем-то доказательстве. В таких случаях я беру одну из многих моих книг по статистике, открываю командную строку языка R, начинаю строить графики и показываю их. Но практически всегда мне говорят, что я идиот. А когда этот человек программист, это даже хуже, поскольку я еще и показываю как это лучше сделать.

Приведу еще одну аналогию. Я встретил парня из Арканзаса, который сказал, что возможно изобрести вечный двигатель. «Да, сэр, вечный двигатель возможно сконструировать. Я прочитал это в интернете вчера. Ага». Обычно, в таких разговорах я даже не знаю с чего начать. «Не верь тому, что прочитал в интернете…». Нет же, этот парень читает «Hustler», поэтому лучше пусть читает хотя-бы в интернете. «Видишь ли, закон…» Опять же нет, физику здесь лучше вообще не использовать. Мне просто нечего сказать.

Разница между каким-то деревенщиной с Арканзаса и программистом без убедительных доказательств своей правоты в том, что, по идее, программист должен знать больше. Скорее всего, он более образован или умен, а может быть и то, и другое.

Кстати, вас не удивляет, что я говорю «он»? С женщинами-программистами у меня никогда не было таких проблем. Может быть потому, что я высокий или лучше к ним отношусь, но они всегда открыты к получению новых знаний и размышляют рационально. Если же они не согласны, то ведут спор крайне расчетливо и аргументируют сказанное. Поэтому я думаю, что женщины как программисты лучше мужчин, поскольку они менее эгоцентричны и более заинтересованы в развитии, чем в доказательстве собственной правоты.

Список вещей, которые меня раздражают

Этот список я мог бы продолжать вечно, но я пройдусь по основным моментам, которые меня бесят — это повсюду в IT индустрии. Измерения производительности, планирование распределения мощностей, документация к продукту и все, что пишет Microsoft про Linux. Я подробно остановлюсь на каждом пункте и опишу, как это можно прекратить и что почитать на эту тему.

Синдром «десяти в степени»

«Все, что Вам нужно сделать, это протестировать алгоритм [вставить степень 10] раз и усреднить результаты». Обычно это число берут равным 1000, но если тестирование занимает больше двух минут (ровно такое количество времени может сохранять концентрацию средний программист), то это число равно 10. Понятие «усреднения» я рассмотрю ниже, а пока обсудим проблемы с выбором количества итераций тестов равным «степени десяти» — я продемонстрирую эти проблемы на графике, которые обычно приводятся в таких случаях.

Откуда вы взяли, что 1000 – подходящее число итераций для улучшения производительности эксперимента?

«Производительность эксперимента» — знаете ли вы что означает этот термин? По сути это вероятность того, что Ваш опыт проводится верно (не совсем верное, но довольно точное определение). Для определения этой вероятности используется серьезный математический аппарат, а в языке R для этой цели написана функция, которая определяет размер тестирующей выборки, основываясь на желаемых показателях точности эксперимента. Для справки посмотрите функции power.t.test, power.prop.test в R.

Как вы проводите тестирование?

1000 последовательных итераций? Или 10 запусков по 100 тестовых значений? Статистические данные при этом будут отличаться, но второй вариант предпочтительней. В этом случае есть возможность сравнивать средние значения результата по каждой выборке и выяснить, есть ли смещение в выборке.

Как вы определяете, что 1000 – достаточное число для того, чтобы процесс пришел в стабильное состояние?

Общей характеристикой всех процессов является то, что все процессы вначале имеют период нестабильности. Этот период обычно не учитывается при проведении исследований, за исключением тех случаев, когда тестирующая выборка имеет такую длину, которая включает в себя этот период. Многие думают, что длины выборки в 1000 элементов более, чем достаточно, но это полностью зависит от того, как функционирует система. Многим сложным интерактивным системам вполне достаточно 1000 итераций для перехода в стабильное состояние, тем более что 1000 операций такие системы выполняют быстро. Представьте себе систему проведения банковских операций, которая обрабатывает 10000 операций в секунду. Мне понадобилась целая минута, чтобы привести систему в стабильное состояние, так что тестирование на тысячу итераций это плавание по верхам.

Что делать если проведение 1000 экспериментов длится 10 часов? Как 1000 последовательных запросов поможет Вам определить производительность системы под нагрузкой?

Вы запускаете 1000 тестовых итераций последовательно, а потом выясняется, что система не выдерживает параллельной нагрузки. И это нормально, поскольку при параллельной нагрузке система имеет другие показатели производительности.

Мастер Йода рекомендует:  Партнерская программа AliExpress как один из способов монетизации сайта

Если все что вы делаете для замера производительности системы это запуск 1000 тестов и расчет среднего, то, как тогда выявить узкие места в производительности? Прочитайте раздел «Только средние значения» чтобы узнать больше. Эту проблему можно наглядно продемонстрировать на графике. Используя следующий код на R:

Здесь создается два множества случайных чисел, распределенных по нормальному закону. Теперь, если я просто возьму среднее (среднее арифметическое или медиану) двух множеств, эти значения почти совпадают:

Оба значения приблизительно равны 30 (число 30 было передано вторым параметром). На этом моменте программисты могут закидать меня камнями, потому что если вы посмотрите на график значений величин, то увидите разницу (а – оранжевый, b – синий)

График значений величин из случайных множеств

Третий параметр указывает на то, что мы хотим получить значения с разными среднеквадратическими отклонениями. Это сделает диапазон возможных ответов «шире» и при этом графики величин будут отличаться при одинаковых значениях среднего арифметического и медианы. Результат работы функции summary из языка R:

Даже без построения графика ясно, что диапазоны значений разные.

Только средние значения

Один очевидный момент доводит меня до исступления. Обычно это происходит, когда программист утверждает, что его система может обрабатывать [степень десяти] запросов в секунду. Цифра [степень десяти] для меня действует как красная тряпка для быка . [Степень десяти] неплохой показатель, если он был получен в результате тщательного исследования. Но обычно эта цифра берется с потолка.

Но больше всего меня тревожит то, что, кроме средних значений, нет никакой информации о диапазоне значений или дисперсии. Если взглянуть на предыдущие графики, то можно визуально понять, почему это проблема. Два средних значения равны, но кроют в себе большие различия в поведении. Без среднеквадратического отклонения невозможно выяснить находятся ли значения близко друг от друга. Для нормально распределенных данных лучше использовать тест Стьюдента для проверки есть ли различия между значениями.

Рассмотрим среднеквадратическое отклонение двух выборок:

Вот теперь видно различия! Если бы это были бы значения производительности веб-сервера, я бы сказал, что второй сервер (обозначенный b) нестабилен. Нет, он не будет ломаться, но его производительность настолько непредсказуема, что вы никогда не сможете спрогнозировать, время выполнения запроса. Несмотря на то, что среднее время обработки запросов у двух серверов одинаковое, пользователи все равно будут думать, что второй сервер работает медленнее, поскольку время обработки команд у того случайно. Конечно, среднеквадратическое отклонение не может быть характеристикой производительности сервера, поскольку тот имеет отрицательные временные значения, но это было приведено для примера.

Почему это так важно? Вот еще два графика иллюстрирующих как важно последовательное поведение для измерения производительности – и собственно, всех характеристик процессов, которые можно измерить. Первый график – это выборка а, и второй график выборка b:

Гистограмма значений из выборки а

Обычно таких графиков не получается после измерений производительности, но идея остается той же. Первый график представляет из себя гладкую кривую. При этом график соответствует гистограмме. Так должен выглядеть процесс с последовательным поведением.

Гистограмма значений из выборки b

Второй график демонстрирует полный хаос, который происходит во время процесса. Этот график иллюстрирует тот факт, что процессы с непоследовательным поведением не соответствуют своему предполагаемому распределению. Мы знаем, что значения распределены по нормальному закону, но график показывает обратное.

Мораль сей басни такова – если вы измеряете средние значения без среднеквадратической ошибки, вы точно делаете что-то не так. Основная цель измерений – получить краткую и точную картину происходящего в системе, и если вы не нашли среднеквадратическое отклонение и не построили хотя бы пару графиков, тогда вы облажались.

Неоднозначность, неоднозначность, неоднозначность

Неоднозначность. Самая элементарная часть любого научного эксперимента, которую, тем не менее, сложнее всего объяснить программисту. Принцип довольно прост: нужно измерять только однородные величины. Тоже мне новость! Но этот принцип сложнее выполнять в лабораторных исследованиях, особенно если они связаны с сельским хозяйством. При этом неоднозначности программисты могут легко избежать при помощи разделения систем.

Вот пример, почему неоднозначность это плохо. Представьте, что Вам поручено сравнить несколько вкусов мороженого, но часть брикетов подтаяла, а часть заморожена. То есть температурный показатель при этом имеет неоднородную структуру для проведения Вашего сравнительного анализа. Для того, чтобы избавится от этой проблемы нужно все мороженое привести к одной температуре. Можно, конечно, и заморозить его, но идея, думаю, понятна.

А как определить факт того, что измеряемые величины неоднозначны, неоднородны? В реальных условиях иногда это сделать невозможно, поэтому умные люди предлагают уменьшить влияние неоднородности данных. Один из способов – это перемешать в случайном порядке значения неоднородного элемента таким образом, чтобы неоднородность не влияла на исследование. Если необходимо узнать какое удобрение лучшее, но свойства почвы и воды отличаются на всех 20 акрах поля, то Вам нужно поместить удобрения в случайные места на поле. Задача становится еще более сложной, поскольку есть участки поля с очень плохой плодородностью.

Погодите, мы же программисты, а не фермеры. Можно взять строку кода и протестировать ее. Можно проверить один запрос к БД, что в таком случае нас останавливает? Глупость, вот что. Программисты просто не сталкиваются с неоднозначностью данных и компании используют их для сравнения производительности или безопасности систем, которые полностью состоят из неоднородных элементов.

Классическим примером является приложение Pet Store от Sun. Pet Store – пример приложения, которое показывает основы J2EE. Потом Microsoft реализовала аналогичное приложение при помощи ASP. При этом по производительности приложение обставило аналогичное написанное на Java. При этом провести сравнительный анализ систем оказалось невозможно. Приложения были запущены на различных ОС, отличались URL, элементы форм, базы данных на сервере и процедура тестирования отличались кардинально. Сравнение приложения проводилось для замера количества пользователей Х, но не включало в себя время выполнения на одной странице, какие конфигурации БД были использованы, системные настройки.

Для проведения такого сравнительного анализа необходимо свести к минимуму количество отличающихся элементов. Одинаковые БД, ОС, одинаковый дизайн страниц и форм, логика приложения. Еще более правильный подход – это сравнивать производительность не на всех этапах работы приложения, а только интересующие моменты, например производительность при отрисовкe HTML страниц.

Возможность исключить неоднозначные элементы чтобы понять суть проблемы – также ценный инструмент анализа. Я работал на финансовую компанию, которая выпустила приложение для отдела продаж. Мы провели всю ночь воскресения, настраивая систему, а на утро понедельника получили странные 2-3 минутные задержки при выполнении некоторых запросов. Наш прямой начальник (это женщина) поручила мне разобраться с этим.

Ответственный менеджер утверждал, что виноват администратор БД. Виновны мы программисты. В общем, он обвинял всех и вся. Я проверил программный код, но ничего странного не заметил. Я решил пройтись по каждому элементу в цепочке, по которой обрабатывался запрос. Отрисовка JSP? Нет, время отрисовки – доли секунды со среднеквадратическим отклонением в доли секунд. Программный код контроллера? Нет. БД Microsoft SQL? Нет. БД показывает прекрасную производительность и стабильное поведение.

Тогда я посмотрел на IBM DB2. И тут была зарыта собака. Почти все запросы выполнялись прекрасно, кроме одного, который, в среднем, отрабатывал за доли секунды, но со среднеквадратическим отклонением в 60 секунд!! Я сделал график времени выполнения запросов, сделал разбивку по таблице и сказал «Дело не в самой базе данных, а в ее настройках. Вот расчеты, которые это показывают».

На следующий день уже IBM исправляло эту проблему (оказалось, что проблема возникала при обновлении индекса БД) и все мы сохранили свои должности.

Определение «пользователя»

Я работал с одним кретином, которого мы называли Mr. BJ, который постоянно утверждал, что мои вычисления не стоят ломаного гроша. Я проводил сравнительный анализ системы Х и показал, что она не выдержит большого количества запросов от студентов (это была университетская система). Он сказал, что я ошибся, поскольку я не измерил какое количество«пользователей» выдержит система. Я спросил у Mr. BJ как он определяет «пользователя», на что он ответил: «Ну, он заполняет формы, клацает везде».

Перед тем, как что-либо измерять, нужно вначале получить четкое понимание того, что мы измеряем. Вам нужно измерять значения только одной атомарной величины, чтобы не смешивать все. До сих пор я вижу разработчиков, которые выпрашивают огромные суммы денег на покупку дурацкой программы, которая даже не подразумевает подсчет каких-то статистических показателей вроде «среднеквадратического отклонения», но зато оперирует «пользователями».

Больше всего меня бесит то, что люди в IT верят всем характеристикам, которые измеряются в рамках «среднего пользователя». Существуют целые научные дисциплины для определения, что же такое «средний пользователь». Ваш ничтожный Jmeter со своими мерзкими графиками и еще более худшим подсчетом статистики ничем не поможет Вам со сбором статистики от Ваших пользователей.

Какое количество данных может быть обработано за секунду?

Конечно, «количество данных» зависит от приложения, но если Вам необходимо обрабатывать 1000 запросов в секунду, а Ваш Веб-сервер максимально обрабатывает 100 запросов, то Ваше приложение, пусть даже использующее JSP+EJB+Hibernate+SOAP, не выдаст результатов лучше.

Измерение любы других параметров это как определять у кого самый быстрый автомобиль поехав за яйцами в супермаркет. В итоге, все что вы получите — это битые яйца.

Дополнительная информация по теме

Я прочитал много книг по теме, но есть несколько, которые вы можете посмотреть:

Статистика в веб-аналитике, или Как стать настоящим Data Scientist

Получайте новые статьи на эл. почту

Зачем нужна статистика в веб-аналитике

Итак, что делать с информацией, которую вы собираете на своем сайте? Первое и самое простое, что можно узнать — откуда приходит трафик и его основные характеристики, число посещений, клики и т.д. Для этой задачи достаточно стандартных отчетов в Google Analytics.

Однако для расчета относительных метрик ( ROAS Прибыль от размещения рекламы = доход от размещения рекламы / расходы на рекламу × 100% , CPC Сумма, которую рекламодатель платит за один клик по его рекламе и др.) Google Analytics не подходит — иначе получится, как в анекдоте, средняя температура по больнице. Если не учитывать специфику отдельных рекламных каналов, внешние факторы и запущенные тесты, достоверность вычисляемых метрик сводится к нулю.

Есть вопросы и бизнес-задачи, ответы на которые можно найти, применив статистические методы. Например:

  • Классифицировать пользователей, чтобы эффективней работать с рекламными кампаниями.
  • Оценить изменения в дизайне сайта. К примеру, узнать с помощью A/B тестирования, как уменьшение количества полей в форме заказа повлияло на конверсию.
  • Понять, насколько критичной является просадка либо рост той или иной метрики. Для этого необходимо определить интервал допустимых значений основных метрик на сайте.
  • Спрогнозировать поведение пользователя на сайте по тем или иным показателям. Определить потенциальных покупателей и запустить для них рекламные кампании.

Условно весь процесс анализа данных можно разделить на три части:

  1. Digital-аналитика — сбор и анализ полученных данных. Этот этап включает в основном поверхностный анализ взаимодействий пользователей с сайтом и оценку маркетинговых усилий. Digital-аналитики помогают, к примеру, определить самые популярные страницы и категории товаров, найти слабые стороны в функционале сайта.
  2. Data governance — управление данными. Этот этап включает координацию задач между разными отделами в компании и управление доступом к данным.
  3. Data science — наука обработки и управления данными. На этом этапе происходит более глубокий анализ собираемых данных: поведение пользователей на сайте, офлайн-продажи, продажи через колл-центр, данные из CRM. Data Scientists могут оценить влияние того или иного фактора (источник привлечения, геолокация, день недели и т. д.) на наблюдаемый результат, например, конверсию и построить прогноз.

Чем Digital-аналитик отличается от Data Scientist

Фактически Digital-аналитика — это первая ступень на пути к Data Science. Наука о данных широко применяется в различных сферах: аналитике, биологии, медицине, психологии, политологии и т.д. Независимо от сферы деятельности любой Data Scientist должен:

  • Разбираться в предметной области и анализировать имеющиеся результаты.
  • Работать с большим объемом данных (владеть языками программирования R и Python, применять машинное обучение).
  • Разбираться в статистических методах анализа (математическая подготовка).

Если изобразить эти требования схематически, то получится вот такой рисунок, на котором Data Scientist будет в самом центре:

Чтобы понять разницу между Digital-аналитиком и Data Scientist, рассмотрим конкретный пример. Допустим, доход от сайта снизился на 3% по сравнению со средним значением прошлой недели.

  • Подсказать источник, где есть резкое падение трафика.
  • Определить время, когда проявилось снижение.
  • Подсчитать точный процент падения трафика для разных источников.

Data Scientist, используя методы математической статистики, будет рассматривать ситуацию с другого ракурса. Для начала он ответит на вопрос, выходит ли полученное значение дохода за границы области допустимых значений этой метрики (так называемый доверительный интервал). Является ли изменение дохода критичным. Возможно, на это изменение не стоит реагировать, например, если сегодня доход ниже чем на прошлой неделе, но не ниже среднего показателя за месяц.

В целом направление Data Science позволяет решать следующие задачи:

  • Управлять рисками, то есть советовать управленческие решения, которые снизят вероятность неблагоприятного результата и минимизируют возможные потери бизнеса. Подробнее о методах оценки риска вы можете почитать в этой статье.
  • Прогнозировать практически любые важные для вашего бизнеса показатели. Можно использовать для этого модель Бокса-Дженкинса. К примеру, построить прогноз по продажам конкретных товаров на заданный срок. Благодаря этим прогнозам можно планировать закупки, ценовую политику, рекламные кампании и акции.
  • Классифицировать пользователей с помощью логистической регрессии, пробит-регрессии или ROC-кривой. Например, для таргетирования. Вот интересный материал о том, как использовать логистическую регрессию для диагностики заболеваний и оценки кредитоспособности.

А теперь давайте разберем подробнее пару задач, для решения которых нужно применять статистические методы.

Как применять статистические методы в A/B тестировании

A/B тестирование, пожалуй, одна из самых распространенных задач в веб-аналитике. Чтобы результаты тестирования стали по-настоящему полезной информацией, на которую можно положиться, их нужно проверять на значимость. В этом-то и поможет статистика. При проведении A/B тестов следует учитывать такие понятия, как статистическая мощность, длина выборки, доверительный интервал и статистическая значимость. А теперь давайте на примерах разберем, что они означают.

Статистическая мощность измеряется в процентах и определяет, насколько вероятно, что тест покажет разницу между вариантом А и В, если она есть. К примеру, вы хотите проверить гипотезу, что мужчинам больше нравится зеленый цвет, чем красный. Если вы покажете разные варианты кнопки двум мужчинам и один нажмет красную кнопку, а другой — зеленую, можно ли говорить, что ваша гипотеза опровергнута? Конечно нет, потому что один из двух мужчин мог оказаться любителем ярких цветов или дальтоником. Если же вы покажете кнопки, например, тысяче посетителей сайта мужского пола, то уже сможете определить, кнопка какого цвета нравится мужчинам. То есть, чем больше длина (размер) выборки для теста, тем выше его статистическая мощность. Не стоит доверять тестам, статистическая мощность которых ниже 80%.

Так какой же должна быть выборка, чтобы результат был достоверным? Это зависит от того, какой статистической мощности и значимости (о ней мы напишем чуть ниже) вы ждете от теста. К счастью, считать длину выборки вручную совсем не обязательно — есть огромное количество удобных онлайн-калькуляторов, например этот. Как пользоваться этим калькулятором, вы можете почитать в статье.

Следующий аспект, который нужно учитывать при A/B тестировании — это статистическая значимость. Она определяет, насколько вероятно, что тест показал разницу между вариантом А и В, которой в действительности не существует. Оптимальный уровень значимости для А/B теста (также его называют доверительной вероятностью) составляет 95%. То есть вероятность ошибки (так называемое Р-значение) составляет оставшиеся 5%. Статистическая значимость теста зависит от доверительных интервалов и площади их пересечения.

Доверительный интервал Предельные значения показателя, который с заданной доверительной вероятностью будет находиться в этом интервале при выборке большего объема показывает, насколько стабилен показатель, который вы получили в результате теста, то есть повторится ли он, если увеличить выборку. Допустим, вы показали тысяче посетителей своего сайта зеленую кнопку (вариант А), и 30% на нее нажали. Вычисляем погрешность для доверительного интервала с помощью онлайн-калькулятора и получаем ± 2,8%. Это значит, что если увеличить выборку, то с вероятностью в 95% на зеленую кнопку нажмут от 27,2% до 32,8% посетителей. Другой тысяче посетителей вы показали красную кнопку (вариант B), и на нее нажали 26%. Доверительный интервал для этой группы — от 23,3% до 28,7%.

Если сравнить доверительные интервалы для вариантов А и B, мы увидим, что они пересекаются в диапазоне от 27,2% до 28,7%. Графически это выглядит так:

На горизонтальной оси графика — KPI (в нашем случае конверсия), на вертикальной оси — плотность вероятности (плотность распределения случайной величины).

Чем меньше площадь пересечения доверительных интервалов, тем выше достоверность результатов тестирования. В нашем примере это пересечение составляет 1,5%. Эта цифра не превышает Р-значение в 5%, а значит тесту можно доверять.

Существует ряд статистических критериев, которые помогают решить, принимать или не принимать изначально поставленную гипотезу. Один из самых известных и применяемых — t-критерий (или критерий Стьюдента). На самом деле под t-критерием, как правило, понимают не один конкретный метод, а целый класс методов проверки статистических гипотез, основанных на распределении Стьюдента. Вот пример калькулятора, с помощью которого можно рассчитать t-критерий и проверить корректность теста. Просто заполните зеленые ячейки своими значениями, которые вы получили в результате тестирования.

А для гиков есть формулы 🙂

Применить t-критерий можно только при следующих условиях:

  1. Исходные данные должны иметь нормальное распределение.
  2. Если применяется двухвыборочный t-критерий для независимых выборок Проверяет гипотезу о равенстве средних значений в двух выборках. Применяется, например, когда нужно сравнить оценки по итоговому экзамену в двух разных ВУЗах , дисперсии должны быть равны.

Двухвыборочный t-критерий для независимых выборок

Если размеры выборок отличаются незначительно, применяется упрощённая формула приближенных расчетов:

где и — случайные величины, n1 и n2— количество элементов выборки, а

Количество степеней свободы рассчитывается как:

Основные преимущества t-теста в том, что он:

  • Нормально работает с огромными выборками (нет ограничения на объем данных).
  • Учитывает распределение и величину выборки.
  • Подходит для измерения разных параметров (можно сравнивать и количественные показатели в том числе).

Итак, вы решили стать Data Scientist. С чего начать?

Мы сделали подборку самых популярных и интересных ресурсов для легкого старта на пути от аналитика до Data Scientist.

В сети доступно множество бесплатных курсов, которые проводятся в формате лекций. После каждой лекции вы получаете небольшой список заданий и тем для самостоятельного изучения. Если что-то не выходит, вы можете задать вопрос преподавателю на форуме. Кроме того, по завершению курса можно получить платный сертификат. Вот несколько доступных площадок:

Язык программирования R — наиболее распространенный инструмент для работы с большими данными. Вот несколько ресурсов, которые помогут вам выучить язык и пообщаться с профессионалами:

И приятная плюшка — онлайн-игры по теории вероятностей и математической статистике:

Мы обещали парочку примеров использования статистических методов, а в статье уместилось только A/B тестирование. Оставьте свой email, и мы пришлем вам файл с примером, как классифицировать пользователей. Вы сможете выделить сегменты с наиболее высоким и низким LTV Прибыль, которую компания получает от одного клиента за все время сотрудничества с ним , чтобы применять для них разные маркетинговые стратегии.

Надеемся, статья была полезной 🙂 Если у вас остались вопросы, охотно ответим на них в комментариях.

Рейтинг языков программирования 2020

Разработка мобильных, корпоративных, десктопных и веб-приложений

# Компания Год Парадигма Типизация
+1 JavaScript 1995 объектно-ориентированная, функциональная, процедурная динамическая, неявная
−1 PHP 1995 объектно-ориентированная, функциональная, процедурная динамическая, неявная
$ Directual 2020 Low-code платформа — фреймворк для быстрой разработки
+1 Java 1995 объектно-ориентированная, процедурная статическая, явная
−1 Objective C 1983 объектно-ориентированная статическая / динамическая, явная
Python 1991 объектно-ориентированная, функциональная, процедурная динамическая, неявная
+1 C# 2000 объектно-ориентированная, функциональная, процедурная статическая / динамическая, явная
+4 Swift 2014 объектно-ориентированная, функциональная статическая, неявная
C++ 1983 объектно-ориентированная, процедурная статическая, явная
−3 Ruby 1995 объектно-ориентированная, функциональная, процедурная динамическая, неявная
C 1972 процедурная статическая, явная
−2 Perl 1987 объектно-ориентированная, функциональная, процедурная динамическая, неявная
new Go 2009
new Kotlin 2011 объектно-ориентированная статическая
−2 Lua 1993 объектно-ориентированная динамическая, неявная

Среди других языков программирования при обработке данных респондентов рассматривались: ActionScript, Clojure, CSS, Erlang, HTML, Less, Parser, R, Scala, Tcl.

О рейтинге

Рейтинг языков программирования проводится Тэглайном в третий раз и сформирован на основе опроса (проводился с апреля 2020 по май 2020 года) 445 технических руководителей digital-компаний: респондентам предлагалось выбрать один или несколько вариантов ответа на вопрос «Укажите языки программирования, которые вы используете для разработки проектов».

Динамика приводится по сравнению с данными, полученными Тэглайном за период с апреля 2020 по май 2020 года.

Комментарии экспертов

1. При выборе языка программирования на проект выбор встает между двумя сторонами — выбрать старый проверенный инструмент или новый, красивый, функциональный, но мало проверенный, а следовательно, ненадежный язык. Как разумнее поступить в этой ситуации? Каковы риски каждого из решений, и как с ними справиться?

Игорь Зильберг, SmartHead
Нужно выбирать инструменты по адекватности задаче и по наличию опытной команды, знакомой с выбранными инструментами. Риски при работе с новыми инструментами минимизируются исследованиями, созданием proof of concept, привлечением опытных консультантов. Новые технологии должны изучаться постоянно, но применяться, только если они лучше подходят для решения конкретной задачи.

Александр Макарчук, qb
Для бизнеса понятия «красивого языка» не существует. Сделать ставку на новый непроверенный язык можно только в том случае, если он гарантированно даст проекту какое-то особенное УТП, которое клиенты смогут почувствовать, а главное — захотят за него заплатить. Если это условие выполняется, то выбрать новый язык можно, но при этом придется принять на себя и все связанные с ним риски.

Григорий Никонов, Actis Wunderman
Конечно же, зависит от проекта и зрелости самого языка. Если проект позволяет, или использование языка является необходимым условием, и доступны нужные предметные библиотеки, то вполне можно позволить эксперимент. Риски очевидны: «подводные камни», на которые можно наткнуться на половине пути. Минимизация этих рисков тоже очевидна: по возможности провести исследования до начала проекта и убедиться, что, как минимум, есть активная поддержка языка в форумах или у производителя.

Алексей Персианов, Михаил Парфенюк, ADV
В этом вопросе все зависит от сроков и бюджетов проекта. Если и то, и то сильно ограничено, то любые изыскания не оправданы и способны принести большие проблемы, вплоть до полного провала проекта.

Алексей Федоров, «Одноклассники»
Ответ сильно зависит от того, какова планируемая длительность проекта. Если это небольшой проект на заказ, который надо быстро сделать, сдать и забыть о нем — тогда можно выбирать все, что угодно. Если это большой проект на года — то лучше выбрать проверенные технологии, на которые можно будет нанять нужное вам количество специалистов. Для того, чтобы оценить, сколько в вашем регионе есть специалистов по той или иной технологии, достаточно воспользоваться любым разумным сервисом, например, LinkedIn или HeadHunter. А дальше уже нужно смотреть на нефункциональные требования: нагрузка, безопасность, отказоустойчивость и т. п.

2. Какие существенные факторы дают гарантию, что язык можно и нужно использовать на продакшне?

Игорь Зильберг, SmartHead
Гарантии в этом мире не дает никто и ничто. Мы полагаемся на свой опыт и распространенные best practice.

Александр Макарчук, qb
Можно выделить три основных признака, которые говорят о том, что использовать тот или иной язык выгодно и безопасно. Во-первых, наличие у данного языка «живого» комьюнити, во-вторых, наличие успешных кейсов, и в-третьих, поддержка языка крупными вендорами.

Григорий Никонов, Actis Wunderman
Наличие «зрелых» предметных библиотек и фреймворков, активное интернет-сообщество, предлагающее советы в решении проблем, отсутствие негативных отзывов о стабильности и производительности конечного приложения.

Алексей Персианов, Михаил Парфенюк, ADV
Факторами являются комьюнити данного языка, количество реализованных проектов, количество разработчиков и прочее. Выпуск на продакшн продукта на новом и сыром языке скрывает большие проблемы с поддержкой.

Алексей Федоров, «Одноклассники»
Формальная гарантия может быть подкреплена только контрактом. Если есть серьезный вендор (например, Oracle, SAP, IBM), который гарантирует, например, что его технология будет поддерживаться ближайшие 10 лет, и с этим вендором подписан соответствующий Support Contract, то, в принципе, вы можете считать это какой-то гарантией. Проблема в том, что обычно это очень дорого, а качество саппорта у больших вендоров, как правило, отвратительное.

Поэтому в мире в последние годы принята другая практика — open source. Если у вас есть опенсорсный инструмент (язык, фреймворк, база данных или все что угодно) с открытым исходным кодом, то это вам дает некоторую гарантию того, что если в этом инструменте вдруг обнаружится баг, то вы в крайнем случае сможете поправить этот баг своими руками. Именно это свойство opensource-решений я считаю ключевым для сегодняшнего бизнеса.

3. Как действовать, если разработчик или даже несколько разработчиков предлагают изменение языка программирования, но по ситуации видно, что их азарт не подкреплен адекватными бизнес-требованиями к технологии?

Игорь Зильберг, SmartHead
Разработчики не предъявляют бизнес-требований. Их предъявляет бизнес. Однако бизнес зависит от качества кода, который пишут разработчики. Поэтому, если разработчики хотят использовать технологию, которая явно не подходит для решения бизнес-задачи, то надо либо убедить разработчиков, либо поменять. Адекватный и опытный разработчик в состоянии понять бизнес-требования и применить наиболее адекватное им решение. У нас подобных проблем не было. В нашей практике чаще происходит наоборот: заказчик вместо того, чтобы формулировать бизнес-требования, влияет на выбор технологии (часто в ущерб реализации собственных требований).

Александр Макарчук, qb
Если переход на новый язык не подкреплен ощутимыми аргументами и не сулит проекту серьезных преимуществ, то он не нужен. Но разработчикам, конечно, это необходимо объяснить, чтобы у команды не складывалось впечатления, что к ней не прислушиваются.

Григорий Никонов, Actis Wunderman
Придерживаться консервативной политики и не менять язык без веских оснований. Всегда будет другой проект, на котором можно будет опробовать новый язык.

Алексей Персианов, Михаил Парфенюк, ADV
Пойти навстречу разработчикам можно только в случае внутреннего проекта, или если он пишется для обучения команды. В этом случае риски неудачи невелики, и при неудаче выносится полезный опыт на будущее. В противном случае бизнес не оценит перфекционизма разработчиков.

Алексей Федоров, «Одноклассники»
Во-первых, следует спросить, чем обоснована идея по смене языка. Что это даст? Каковы плюсы и каковы минусы? Какова стоимость такого перехода и каковы сроки? Каковы риски?

Если полученные ответы вас устраивают с точки зрения бизнеса — вперед. Если не устраивают — нужно постараться донести до разработчиков причины, по которым вы им отказываете.

4. Когда затраты на переход с одного языка на другой стоят того?

Игорь Зильберг, SmartHead
Оценить затраты на смену платформы и сопутствующие выгоды невозможно вне контекста проекта. Такое решение может приниматься только на основании осознанного подхода в рамках конкретного проекта, а не на основании каких-либо «универсальных» мнений или правил.

Александр Макарчук, qb
Когда это повлечет за собой ощутимую прибыль, как прямую, так и косвенную вследствие появления у проекта нового УТП, которое сделает продукт конкурентоспособнее.

Григорий Никонов, Actis Wunderman
В случае, когда использование нового языка позволяет существенно оптимизировать всю жизненную цепочку предметной области: от проектирования, разработки и тестирования приложения до внедрения и последующих обновлений и доработок за счет свойств языка и экосистемы вокруг него.

Алексей Персианов, Михаил Парфенюк, ADV
Когда поддержка языка прекращена, а вместе с тем и количество специалистов на рынке стремится к нулю. Или если вы полностью теряете старую команду без возможности сохранить технологии. Когда профит от языка будет больше, чем затраты на его переход.

Алексей Федоров, «Одноклассники»
Когда у вас и ваших коллег есть четкие ответы на обозначенные выше вопросы.

5. Считаете ли вы, что существует устоявшееся разделение применения языков для определенных задач? Если да, то как именно вы его видите? Может ли появиться или уже существует язык, который изменит ситуацию и перетянет на себя большую часть разработчиков?

Игорь Зильберг, SmartHead
Конечно же, есть некоторые типовые сферы применения разных платформ (не языков). Например, Java и .NET для относительно крупных бизнес-приложений или сервисов. Node.js для многопоточной обработки и мессенджинга. Все не перечислить. Однако эти границы очень и очень размыты и зависят так же от региона. В США, например, немного другой опыт использования, «мода» и типовые сферы применения платформ, нежели у нас.

Александр Макарчук, qb
С одной стороны, устоявшееся разделение языков по применению существует, но с другой — довольно сильное значение имеют региональные и ценовые факторы: стоимость вхождения в технологию, поддержки и т.п. Что касается появления новых языков, то здесь нужно заметить такую вещь. За последние несколько лет уровень коммуникации вырос значительно, а языки программирования, по сути, все те же. Возможно, именно дальнейшая революция в области коммуникаций повлечет за собой совершенно новые технологии разработки.

Григорий Никонов, Actis Wunderman
В принципе, такое разделение есть: языки C и C++ традиционно используются для низкоуровневой разработки, Java и C# считаются языками общего назначения, подходящими для широкого спектра задач от бизнес-логики до мобильных приложений. Python, Ruby и PHP нацелены, в основном, на веб-разработку, JavaScript — на браузерные приложения. Не думаю, что возможны резкие изменения в этой области, хотя мода на языки и фреймворки иногда меняется — сейчас, например, начинает набирать популярность язык Go.

Алексей Персианов, Михаил Парфенюк, ADV
Да. Некоторые вещи лучше реализуются на разных языках в силу скорости работы и простоты использования, например, в php-проектах в силу «медлительности» языка можно реализовать чат на Node или агрегатор на Java — результат будет лучше.

С каждым годом каждый новый язык получает лавры «лучшего» и перетягивает на себя разработчиков, но пока, наверное, позиции проверенных языков незыблемы. В будущем все может быть.

Алексей Федоров, «Одноклассники»
Большинство известных нам с вами современных языков программирования являются многофункциональными, то есть на них можно делать очень разные решения.

Насчет нового языка — да, такой язык появиться может, но, в силу довольно сильной инертности индустрии, я не думаю, что в ближайшие 5 лет кто-то потеснит Java и С/C++ с пьедестала. Если же и выбирать какую-то «лошадку», то я поставил бы на JavaScript. Сегодня мы видим в индустрии огромный рост всего, связанного c JavaScript. Фреймворки рождаются, как грибы после дождя. Хайп в интернете вокруг этой технологии огромен. Посмотрим, к чему это все приведет.

6. Должен ли программист быть DevOps (обладать навыками программиста и системного администратора)? Что делать с тем, что большинство программистов отказываются развивать компетенции и нести ответственность в этой области?

Алексей Персианов, Михаил Парфенюк, ADV
Для настройки окружения обычно пользуются услугами системного администратора. Но, наверное, есть смысл в том, что человек, который пишет код, должен сам уметь настроить площадку для оптимального исполнения данного кода. Это сэкономит время и затраты.

7. Стоит ли использовать микросервисы в своих проектах?

Алексей Персианов, Михаил Парфенюк, ADV
Однозначного ответа нет, но наш ответ — да. Безусловно, они могут добавить немало проблем, но и помогут решить многие. Например, благодаря микросервисам разные части приложения можно писать на разных языках программирования, есть возможность масштабировать нагруженные части приложения и пр.

8. Должен ли разработчик уметь работать с широким спектром современных веб-технологий и языков?

Алексей Персианов, Михаил Парфенюк, ADV
В последние годы огромный рывок сделал фронтенд, при этом в серверных языках развитие не столь заметное. Разработчик, безусловно, должен знать основы смежных направлений, но быть гуру в серверных языках и в клиентских невозможно, каждый должен заниматься своим делом и быть в нем настоящим профессионалом.

Анализ сайта

Анализ сайта в один клик от Be1.ru поможет проверить состояние важных при продвижении показателей и факторов, от которых напрямую зависят позиции ресурса в выдаче поисковых систем.

  • количество страниц в индексе Яндекс и Google;
  • проверка ИКС и PR;
  • наличие фильтров.
  • список запросов, по которым сайт занимает позиции;
  • количество эффективных показов;
  • график общей динамики видимости.
  • ТОП конкурентов сайта;
  • данные о пересечениях с конкурентами в выдаче;
  • детальный отчет с экспортом.
  • title;
  • description;
  • keywords.
  • отчет по количеству уникальных ссылок;
  • упоминания в социальных сетях;
  • типы ссылок по органичности.
  • проверка текстов на плагиат;
  • тошнотность текстов;
  • равномерность распределения слов.
  • скорость загрузки ресурса;
  • whois данные о владельце;
  • оценка рыночной стоимости сайта.

Зачем проводить анализ сайта?

Поисковые системы ранжируют сайты в своей выдаче по собственным сложным алгоритмам. Учитывая ряд внутренних и внешних факторов, которые так или иначе демонстрируют качество ресурса, поисковики стремятся подобрать самые подходящие ответы на запрос пользователя. Анализ сайта сервисами помогает автоматизировать процесс проверки веб-ресурса по ряду ключевых SEO-значимых факторов, которые влияют на его позиции в выдаче поисковых систем.

Пользователи, которые используют наш сервис, прямо сейчас активно занимают лидирующие позиции в выдаче поисковых систем по ряду запросов своего семантического ядра. Набор SEO инструментов и сервисы Be1.ru проектируются исключительно опытными оптимизаторами со стажем более 10 лет!

Какую информацию я получу после анализа?

Количество страниц в индексе Яндекс и Google, наличие в каталогах, данные о ИКС, PR, посещаемость, наличие вирусов, оценка стоимости сайта, определение уникальности текста и его тошноты, данные Whois, проверка на фильтры, поисковая видимость сайта, количество внешних ссылок, поиск конкурентов и многое другое.

Могу ли я анализировать сайты конкурентов?

Да, можно провести полный анализ любого доступного сайта в интернете. Для этого не нужно обладать правами администратора, необходимо лишь знать его URL адрес. Список конкурентов, по которым сайт больше всего пересекается в выдаче согласно данным о видимости, доступен на общей странице анализа сайта.

Откуда сервис берет информацию о сайтах?

Мы используем API MegaIndex. В основном с его помощью мы получаем дефицитную информацию о сайтах, которую предоставляем в открытом бесплатном доступе. Большая часть инструментов и алгоритмов является собственными разработками команды Be1.ru.

Перетащите букмарклет себе в закладки и пользуйтесь инструментом проще!

На каких языках программирования создают web сайты

С каждым днем IT-сфера становится все шире, и растет спрос на создание сайтов. Это приводит к увеличению количества специалистов, которые готовы взяться за разработку сайта и его поддержку. Однако многие такие веб-мастера пользуются бесплатными конструкторами и имеют очень смутное представление о программировании и технической составляющей сайта. Безусловно, юзабилити, дизайн и контент очень важны, но технически слабый сайт с ошибками в коде не сможет принести его владельцу никакой выгоды. Поэтому за создание сайтов должны браться только те специалисты, которые владеют языками программирования и готовы разработать сайт с нуля.

Какие языки нужно знать, чтобы создавать сайты?

  • серверная платформа;
  • серверное ПО;
  • наличие опыта в создании сайтов;
  • выбранная база данных.

Наиболее популярные языки

Сайты Популярность
(уникальные посетители в месяц)
Front-end
(Клиентский)
Back-end
(Серверный)
База данных
Google.com 1,600,000,000 JavaScript C, C++, Go, Java, Python BigTable, MariaDB
Facebook.com 1,100,000,000 JavaScript Hack, PHP (HHVM), Python, C++, Java, Erlang, D, Xhp, Haskell MariaDB, MySQL,HBase Cassandra
YouTube.com 1,100,000,000 JavaScript C, C++, Python, Java, Go Vitess, BigTable, MariaDB
Yahoo 750,000,000 JavaScript PHP MySQL, PostgreSQL,VB.NET
Amazon.com 500,000,000 JavaScript Java, C++, Perl Oracle Database
Wikipedia.org 475,000,000 JavaScript PHP, Hack MySQL, MariaDB
Twitter.com 290,000,000 JavaScript C++, Java, Scala, Ruby MySQL
Bing 285,000,000 JavaScript ASP.NET Microsoft SQL Server
eBay.com 285,000,000 JavaScript Java, JavaScript, Scala Oracle Database
MSN.com 280,000,000 JavaScript ASP.NET Microsoft SQL Server
Microsoft 270,000,000 JavaScript ASP.NET Microsoft SQL Server
Linkedin.com 260,000,000 JavaScript Java, JavaScript, Scala Voldemort
Pinterest 250,000,000 JavaScript Django, Erlang MySQL, Redis
WordPress.com 240,000,000 JavaScript PHP, JavaScript (Node.js) MariaDB, MySQL

PHP. В его основе — самый простой язык разметки, HTML. PHP связывает пользователя с серверной частью. Именно на этом языке реализуются такие функции, как формы обратной связи, поля регистрации и т. п. Синтаксис этого языка очень легко и просто изучить. Для создания коммерческого портала без PHP не обойтись, так как именно на нем проще всего получить контактные данные пользователя. Базовое достоинство языка состоит в том, что, используя его, программисты могут очень быстро и без лишних усилий составлять динамические страницы.

Python. На русском его часто называют «питон». Это высокоуровневый язык, используемый для общих задач, чаще всего — для выполнения задач сервером. Его ориентир — повышение производительности программиста и читаемости кода. При помощи языка можно выполнять резервное копирование многих парадигм программирования. Питон отлично работает на серверах Windows и Linux.

Ruby. На русском часто его называют «руби». Это динамический, рефлективный и высокоуровневый язык для ООП (объектно-ориентированного программирования). Он дает возможность реализовать многопоточность на любой ОС, отличается строгой типизацией динамического вида, и обладает рядом других опций. По характеристикам синтаксиса Руби ближе всего к аналогам Eiffel и Perl. Кроме того, отдельные детали позаимствованы из Python.

ASP. Этот язык разработан корпорацией Microsoft. С использованием этой технологии можно разрабатывать приложения для www.asp. Платформы для работы языка следующие: Internet Information Server (IIS) и Windows NT. ASP довольно сложно назвать непосредственно языком, это скорее технология для подсоединения программы к интернет-странице. Все достоинства ASP — в простом скриптовом языке и возможностях применения сторонних СОМ-элементов.

  • изменять содержимое страницы: дописывать или убирать текст, менять стили и теги;
  • реагировать на какие-то события (например, на щелчок мыши) и выполнять заданную функцию;
  • отображать сообщения, ставить и считывать cookies, проверять правильность введенных данных;
  • загружать новые данные без перезагрузки документа, и пр.

Perl. Первое время этот язык использовался для соединения программ, которые выполняли разные задачи, в единый сценарий для решения целого комплекса задач: обработки текста, администрирования и пр. Сегодня же Перл используется в основном для разработки приложений CGI. Он помогает администрировать сервера и прочие системы. Благодаря простоте и скорости написания сценария на Перле, его адаптировали ко всем популярным платформам, включая Mac и Windows. Perl имеет открытый исходный код, абсолютно бесплатный.

Разновидности языков веб-программирования.

Одни говорят, что программирование – это искусство, другие – талант, третьи сухо называют программирование процессом создания софта для компьютера. Наш век – век стремительного развития технологий, в том числе и компьютерных. На сегодняшний день почти каждая компания, каждая организация, магазин имеет свой собственный сайт. Сайт выполняет функцию рекламы, а также упрощает работу с клиентами. Это говорит о том, что веб-программирование – это создание сайтов и приложений, работающих в сети. Важным звеном между программистом и программами является язык программирования, а связующим звеном между веб-разработчиком и сайтами – язык веб-программирования .

Языки веб-программирования

Язык веб-программирования – это совокупность операторов, с помощью которых создаются коды веб-программ, или их еще называют скриптами, сценариями. Язык программирования передает понятные компьютеру инструкции для выполнения определенных операций. Так, с помощью языков программирования человек «разговаривает» с машиной. Обычно коды, написанные на веб-языках, читаются браузерами. Среди самых распространенных языков веб-программирования можно отметить: HTML, CSS, PHP, JavaScript, Perl, jQuery:

Язык разметки HTML

HTML (HyperTextMarkupLanguage — “язык разметки гипертекста”) – самый известный для веб-разработчиков язык программирования, хотя по своей функциональности он скорее всего относится к языкам разметки. HTML был создан в 1991-1992 изобретателем Тимом Бернерсом-Ли, британцем по происхождению. Язык применяется для распределения объектов и текста на веб-страницах. Для лучшего понимания сущности языка HTML можно косвенно сравнить с программой Office Word. Язык оснащен тегами, которые и являются, по сути, инструкциями компьютеру.

    Язык программирования PHP.

    PHP (HypertextPreprocessor– “процессор гипертекста ) – является СИ-подобным скриптовым языком. Самая первая версия PHP была разработана еще в 1994, но к 1998 году появилась основная версия PHP – 5.4. Язык PHP широко используется программистами для написания сценариев, которые выполняются на серверах при каждом обновлении страницы сайта. PHP действительно похож на язык СИ, и многое он позаимствовал из языка JAVA и технологии JSP. Сегодня PHP используется многими программистами, потому ядром огромного количества сайтов является php-код.

    Ориентированный язык программирования JavaScript

    JavaScript – язык программирования, созданный для «оживления и придания динамичности» веб-сайтам. Развитие языка началось с 1996 года. Программы, написанные на языке JavaScript,называются скриптами, которые выполняются совместно с HTML-документами. С помощью JavaScript программисты создают некоторые функции, как например открытие нового окошка с выводом в нем сообщения об ошибке после некоторого действия пользователя. Язык JavaScript способен выполнять свои скрипты спустя заданные интервалы времени. В общем, JavaScript это и самостоятельный язык, но также его можно назвать вспомогательным для остальных, так как с помощью него легко сделать сайт более функциональным и интересным для пользователя.

    jQuery

    jQuery – это библиотека многократно используемых объектов и функции JavaScript, созданная Джоном Резигом и представленная в 2006 году. Обычно jQuery является отдельным JavaScript-файлом. jQuery можно назвать фреймворком (framework), т.е. набором операции и инструкции для решения однотипных задач. Библиотека позволяет вам работать и управлять различными объектами на веб-страницах.

    Динамический язык программирования Perl

    Perl (PracticalExtractionandReportLanguage – “практический язык извлечений и отчетов”) – язык программирования, чьим самым важным преимуществом является расширенные возможности работы с текстом. Был создан лингвистом Ларри Уоллом в 1989 году. К функциям Perl также относятся веб-разработка, системное администрирование, разработка графического интерфейса, игр.Perl известен также своим огромным набором модулей. Обычно программисты обращаются к языку Perl тогда, когда сценарий слишком сложен для написания на остальных языках веб-программирования.

    Cascading Style Sheets

    CSS (CascadingStyleSheets- “каскадные таблицы стилей) – язык программирования, который скорее также относится к языкам разметки и форматирования. CSS стал разрабатываться в 1994 году Хокон Виум Ли и Бертом Босом. Основной задачей было создания языка, который бы форматировал HTML-объекты и текст: работал с шрифтами, цветами, стилями. В общих чертах, CSS работает с внешним видом сайтов. Язык CSS используется с целью «украсить» веб-страницы.

    MySQL.

    При создании сайтов программисты сталкиваются с проблемой хранения огромного количества информации. Тут на помощь могут прийти базы данных, которые позволяют хранить в себе неограниченный объем данных. Для создания, ведения и использования баз данных существуют СУБД (Система Управления Базами Данных). Одной из наиболее известных и популярных среди веб-разработчиков считается реляционная СУБД MySQL. MySQL поддерживает огромное количество таблиц, она часто применяется вместе с PHP.

Анализ популярности веб-сайта научной организации с помощью различных систем сбора статистических данных Текст научной статьи по специальности « Экономика и экономические науки»

Аннотация научной статьи по экономике и экономическим наукам, автор научной работы — Скородумов Павел Валерьевич, Холодев Александр Юрьевич

Стремительный рост популярности веб-приложений и сети Интернет связан с современным уровнем развития информационных технологий. Веб-сайты играют значительную роль в развитии современных организаций, обладая огромными функциональными возможностями, позволяя автоматизировать и усовершенствовать множество выполняемых процессов. Научные организации также уделяют самое пристальное внимание поддержке, развитию и продвижению собственных веб-сайтов. Это связано с тем, что количество упоминаний об организации в СМИ и посещаемость официальных веб-сайтов в сети Интернет входят в проект системы критериев оценки деятельности научных организаций Министерства образования и науки РФ и учитываются при оценке деятельности научного учреждения. Особое значение это имеет в связи с проводимой в настоящий момент реформой академической науки, а именно с вопросами реорганизации и перевода на конкурсное финансирование научных институтов, а также со стремлением к расширению международного научного сотрудничества и вхождению российских университетов и научных центров в зарубежные базы данных и рейтинги. Таким образом, на сегодняшний день веб-сайт не только является площадкой для размещения информации, но и способствует формированию единого информационного пространства, объединяющего многочисленные веб-ресурсы, отражающие широкий спектр направлений деятельности научного учреждения. Учитывая значение, которое имеют сегодня вебометрические рейтинги, обращая внимание на роль поисковых систем в определении ранга организации в них, при анализе популярности веб-сайта следует обращать внимание на статистические данные, получаемые с помощью различных систем. В статье приведено обоснование необходимости оценки популярности веб-сайта научной организации , в том числе с помощью различных систем сбора статистической информации. Отмечаются подходы, применяемые к сбору статистических данных. Кратко представлены сервисы Яндекс. Метрика и Google Analytics и их возможности. В статье показан анализ популярности интернет-портала Института социально-экономического развития территорий Российской академии наук по таким критериям, как количество просмотров страниц и число уникальных пользователей. Рассмотрены статистические данные по главному сайту института, сайту научного журнала «Экономические и социальные перемены», а также сайту Научно-образовательного центра экономики и информационных технологий Института социально-экономического развития территорий Российской академии наук. Приведены сравнение статистических данных и возможные причины имеющихся расхождений. В заключении обобщаются итоги проведенного анализа. Отмечаются особенности подсчета статистики посещения сайтов различными сервисами, необходимость проведения подобного анализа, целесообразность проведения модернизации существующего интернет-портала Института социально-экономического развития территорий Российской академии наук и продолжения исследований по данному направлению.

Похожие темы научных работ по экономике и экономическим наукам , автор научной работы — Скородумов Павел Валерьевич, Холодев Александр Юрьевич,

Analysis of the scientific organization website popularity by means of different systems for collecting statistics

The increasing popularity of web applications and the Internet is associated with the modern level of information technologies development. Websites play a significant role in the development of modern organizations, as they have extensive functionality and help automate and improve many conducted processes. Scientific organizations also pay close attention to the support, development and promotion of own websites. This is caused by the fact that the number of mentions about an organization in the media and the attendance of official websites on the Internet are included in the project of the system to evaluate the performance of a scientific organization proposed by the Ministry of Education and Science of the Russian Federation and taken into account in the assessment of the activities of a scientific institution. This is particularly important in connection with the ongoing reform of academic science, namely, the reorganization and transition to competitive financing of scientific institutions, as well as with the desire to expand international scientific cooperation and include Russian universities and research centers in foreign databases and ratings. Thus, to date, the website does not only serve as a platform for posting information, but also contributes to the formation of single information space uniting numerous web resources that reflect a wide range of activities of scientific institutions. Taking into account the importance that webometric rankings have today, paying attention to the role of search engines in determining the rank of an organization, to analyze the popularity of a website one should pay attention to statistical data obtained by means of different systems. The article substantiates the necessity to assess the popularity of the website of a scientific organization, including with the help of different systems for collecting statistical information. It identifies the approaches to the collection of statistical data. It touches upon services, such as Yandex.Metrica and Google Analytics, and their capabilities. The paper shows the analysis of the popularity of the Internet portal of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences by criteria, such as a number of page views and a number of unique users. It considers statistical data on the main Institute’s website, the website of the scientific journal “Economic and Social Changes: Facts, Trends, Forecast”, the Research-Educational Center of Economics and Information Technology of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences. It presents the comparison of statistical data and possible reasons for the differences. In conclusion it summarizes results of the analysis. It mentions features of counting the statistics of website attendance by various services, the need for such an analysis, the usefulness of upgrading the existing Internet portal of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences and continuing research in this area.

Текст научной работы на тему «Анализ популярности веб-сайта научной организации с помощью различных систем сбора статистических данных»

© Скородумов П.В., Холодев А.Ю.

АНАЛИЗ ПОПУЛЯРНОСТИ ВЕБ-САЙТА НАУЧНОЙ ОРГАНИЗАЦИИ С ПОМОЩЬЮ РАЗЛИЧНЫХ СИСТЕМ СБОРА СТАТИСТИЧЕСКИХ ДАННЫХ

СКОРОДУМОВ ПАВЕЛ ВАЛЕРЬЕВИЧ

кандидат технических наук, заведующий лабораторией интеллектуальных и программно-информационных систем отдела проблем научно-технологического развития и экономики знаний Федеральное государственное бюджетное учреждение науки

Институт социально-экономического развития территорий Российской академии наук E-mail: spv.vscc@gmail.com

/» *Л ХОЛОДЕВ АЛЕКСАНДР ЮРЬЕВИЧ

■ | инженер-исследователь лаборатории интеллектуальных и программно-информационных

^ «,-»» Л систем отдела проблем научно-технологического развития и экономики знаний • Федеральное государственное бюджетное учреждение науки

Институт социально-экономического развития территорий Российской академии наук ^t i E-mail: der.goodwin@ya.ru

Стремительный рост популярности веб-приложений и сети Интернет связан с современным уровнем развития информационных технологий. Веб-сайты играют значительную роль в развитии современных организаций, обладая огромными функциональными возможностями, позволяя автоматизировать и усовершенствовать множество выполняемых процессов. Научные организации также уделяют самое пристальное внимание поддержке, развитию и продвижению собственных веб-сайтов. Это связано с тем, что количество упоминаний об организации в СМИ и посещаемость официальных вебсайтов в сети Интернет входят в проект системы критериев оценки деятельности научных организаций Министерства образования и науки РФ и учитываются при оценке деятельности научного учреждения. Особое значение это имеет в связи с проводимой в настоящий момент реформой академической науки, а именно с вопросами реорганизации и перевода на конкурсное финансирование научных институтов, а также со стремлением к расширению международного научного сотрудничества и вхождению российских университетов и научных центров в зарубежные базы данных и рейтинги. Таким образом, на сегодняшний день веб-сайт не только является площадкой для размещения информации, но и способствует формированию единого информационного пространства, объединяющего многочисленные веб-ресурсы, отражающие широкий спектр направлений деятельности научного учреждения. Учитывая значение, которое имеют сегодня вебометрические рейтинги, обращая внимание на роль поисковых систем в определении ранга организации в них, при анализе популярности веб-сайта следует обращать вни-

мание на статистические данные, получаемые с помощью различных систем. В статье приведено обоснование необходимости оценки популярности веб-сайта научной организации, в том числе с помощью различных систем сбора статистической информации. Отмечаются подходы, применяемые к сбору статистических данных. Кратко представлены сервисы Яндекс.Метрика и Google Analytics и их возможности. В статье показан анализ популярности интернет-портала Института социально-экономического развития территорий Российской академии наук по таким критериям, как количество просмотров страниц и число уникальных пользователей. Рассмотрены статистические данные по главному сайту института, сайту научного журнала «Экономические и социальные перемены», а также сайту Научно-образовательного центра экономики и информационных технологий Института социально-экономического развития территорий Российской академии наук. Приведены сравнение статистических данных и возможные причины имеющихся расхождений. В заключении обобщаются итоги проведенного анализа. Отмечаются особенности подсчета статистики посещения сайтов различными сервисами, необходимость проведения подобного анализа, целесообразность проведения модернизации существующего интернет-портала Института социально-экономического развития территорий Российской академии наук и продолжения исследований по данному направлению.

Веб-сайт научной организации, статистика посещения, системы сбора и анализа статистики посещения веб-сайтов.

Развитие информационных технологий привело к стремительному росту популярности веб-приложений и сети Интернет, сегодня практически у каждой организации есть свой собственный корпоративный веб-сайт. Отсутствие последнего негативно сказывается на восприятии организации как среди ее партнеров, так и среди ее потенциальных клиентов. Веб-сайты играют значительную роль в развитии современных организаций, обладая огромными функциональными возможностями, позволяя автоматизировать и усовершенствовать множество выполняемых процессов.

Поддержке, развитию и продвижению веб-сайтов научных организаций сегодня уделяется самое пристальное внимание. В первую очередь это связано с тем, что количество упоминаний об организации в СМИ и посещаемость официальных вебсайтов в сети Интернет входят в проект системы критериев оценки деятельности научных организаций Министерства образования и науки РФ и учитываются при оценке деятельности научного учрежде-

ния [5]. Это имеет особое значение в связи с проводимой в настоящий момент реформой академической науки, а именно с вопросами реорганизации и перевода научных институтов на конкурсное финансирование [10].

Особое значение сегодня имеет расширение международного научного сотрудничества, вхождение российских университетов и научных центров в зарубежные базы данных и рейтинги (в том числе ве-бометрические1). Наиболее авторитетным на сегодняшний день считается рейтинг Кибернетической лаборатории Центра научной информации и документации Национального исследовательского совета Испании (Cybermetrics Lab, Consejo Superior de Investigaciones Científicas), где, в частности, реализован проект «Мировой вебоме-трический рейтинг университетов», являющийся самым известным и масштабным

1 Вебометрика — изучение количественных аспектов конструирования и использования информационных ресурсов, структур и технологий в сети, опирающееся на библиометрические и инфометрические подходы [2].

[1; 14]. Среди российских исследований можно отметить рейтинг ИПМИ КарНЦ РАН2, применяемый его авторами алгоритм расчета существенно скорректирован с учетом отечественных реалий (при ранжировании учитываются данные поисковой системы Yandex, охватывающей российский сегмент интернета) [2].

Если обратить внимание на механизм определения положения университетов или научных учреждений в рейтинге, то можно отметить, что российские исследователи опираются на данные, полученные с помощью поисковых систем Google и Yandex, в то время как их зарубежные коллеги используют поисковые системы Google, Yahoo, Live Search, Exalead и не берут в расчет данных российского поисковика Yandex. С этой точки зрения формирование итоговых рейтингов не совсем корректно, так как учитывает особенности индексации только англоязычных веб-сайтов в сети Интернет.

Необходимо отметить, что вебометри-ческие рейтинги используют для ранжирования сайтов такие критерии, как размер3, видимость4, научность сайта5, количество полнотекстовых файлов6 и альтметри-ку7 [14]. Несмотря на разносторонность используемых при подсчете критериев, вебометрические рейтинги неудобны с точки зрения оперативного контроля популярности веб-сайтов научных органи-

2 Институт прикладных математических исследований КарНЦ РАН.

3 Размер сайта — общее количество страниц, обнаруживаемых на сайте поисковыми машинами.

4 Видимость сайта — количество уникальных гипертекстовых ссылок с других веб-ресурсов, обнаруживаемых поисковыми машинами.

5 Научность сайта — количество ссылок на сайт, обнаруживаемое Google Scholar.

6 Количество полнотекстовых файлов — Суммарное количество файлов с расширениями PDF, DOC,PS и др., обнаруживаемых на сайте поисковыми машинами.

7 Альтметрика — видимость в сетях профессионального общения и сотрудничества ученых.

заций среди их посетителей и принятия своевременных корректирующих воздействий с целью достижения лучших показателей. Это объясняется большим объемом вычислений, проводимых при анализе значительного числа участвующих в оценке учреждений, что в результате приводит к периодичности формирования рейтинга (так, Cybermetrics Lab формирует свой рейтинг исследовательских центров два раза в год, в январе и в июле). Кроме того, применяемые критерии имеют опосредованное отношение к популярности веб-сайта, в большей степени относясь к его содержанию, наполнению и ссылочной массе.

Все вышесказанное позволяет говорить о том, что на сегодняшний день веб-сайт является не только площадкой для размещения информации, но и способствует формированию единого информационного пространства, объединяющего многочисленные веб-ресурсы, отражающие широкий спектр направлений деятельности научного учреждения [4]. Грамотная организация работы с вебсайтом позволяет устранить географические препятствия, мешающие взаимодействию ученых, способствуя в том числе распространению научных знаний.

Продвижение веб-сайта организации невозможно без постоянного контроля посещаемости ресурса, что способствует принятию своевременных обоснованных управленческих решений для корректировки направления его дальнейшего развития. Учитывая значение, которое имеют сегодня вебометриче-ские рейтинги, обращая внимание на роль поисковых систем в определении ранга организации в них, при анализе популярности веб-сайта следует обращать внимание на статистические данные, получаемые с помощью различных систем (Google, Yandex). Это будет способствовать своевременному реагированию на возникновение сбоев при индексации

страниц веб-ресурса различными поисковыми системами, а следовательно, может повлиять и на положение научного учреждения в вебометрических рейтингах в том числе.

Целью данной статьи является анализ популярности веб-сайта научной организации с помощью различных систем сбора статистических данных на примере ИСЭРТ РАН8.

Как отмечалось выше, продвижению, развитию и поддержке веб-сайтов научной организации сегодня уделяется особое внимание. Контроль и оценка этой работы важны с точки зрения принятия мер, направленных на повышение достигнутых показателей.

Для оценки популярности веб-сайта широко применяется веб-аналитика9, целью которой является выделение информации, необходимой для принятия решений по изменению стратегии работы в интернет-пространстве к лучшему [3].

В качестве критериев оценки обычно выступают число уникальных пользова-телей10, количество просмотров11, число зарегистрированных пользователей12, источники входящего трафика13 и др.

С точки зрения способа сбора данных среди методов оценки популярности вебсайтов выделяют два подхода: ручной и автоматизированный. Последний подход получил сегодня наиболее широкое рас-

8 Институт социально-экономического развития территорий РАН.

9 Веб-аналитика — метод изучения опыта пользователей в глобальном информационном пространстве для его улучшения.

10 Уникальный пользователь — неповторяющийся пользователь, посетивший сайт за отчетный период (хотя бы один раз).

11 Просмотр страницы — однократное отображение содержимого страницы сайта на экране компьютера.

12 Зарегистрировавшийся пользователь -пользователь, прошедший процедуру регистрации на сайте в течение отчетного периода.

13 Сетевой трафик — объем информации, передаваемой по сети за единицу времени.

пространение в связи с тем, что позволяет практически полностью исключить зависимость системы сбора статистики посещения веб-сайтов от «человеческого фактора». В свою очередь автоматизированные способы сбора информации делят на [12]:

1. Пассивные, когда сбор осуществляется, например, на стороне сервера, собственными силами организации владельца сайта.

2. Активные, когда за сбор информации отвечают, например, поисковые роботы.

Используемая на текущий момент в ИСЭРТ РАН система сбора статистической информации о посещаемости веб-сайтов ИСЭРТ РАН относится к первому способу и осуществляется силами сотрудников лаборатории интеллектуальных и программно-информационных систем. Решение о реализации пассивного способа сбора статистической информации объясняется большим числом оцениваемых критериев, получение данных по которым с помощью широкодоступных систем затруднено или полностью невозможно (анкетные данные пользователей, популярность статей научных журналов, наиболее активные пользователи и др.) [3].

Информационные сервисы Яндекс.Ме-трика и Google Analytics, разработанные одноименными компаниями, относятся к активному способу сбора статистической информации, предоставляются на безвозмездной основе, а для их подключения необходимо разместить на страницах веб-сайтов организации соответствующий код счетчика [8; 9].

Оба сервиса позволяют оценить большое число параметров, характеризующих посещаемость веб-сайтов организации: количество посетителей, число просмотров, время пребывания пользователей на страницах сайта, а также сформировать демографический портрет и географическое распределение пользователей, определять используемые ими в работе операционные системы, браузеры и дру-

гие технические параметры, позволяющие оценить возможности пользователей по просмотру того или иного контента14. Кроме того, с их помощью можно проанализировать поведение пользователей на страницах ресурса, что является особенно актуальным, так как позволяет за короткое время определить предпочтения пользователей и повлиять на содержимое страниц сайта с целью повышения его популярности.

В целом оба сервиса обладают значительным набором функциональных возможностей, позволяющих детально проанализировать большое число критериев для принятия обоснованного решения по изменению содержания веб-сайта.

Яндекс.Метрика и Google Analytics в большей степени ориентированы на коммерческий сегмент сети Интернет, связанный с интернет-торговлей, чем объясняется значительное число отчетов по определению величины конверсии15 отдельных страниц веб-сайта или источников входящего трафика [3].

Стоит отметить, что сервисы Яндекс. Метрика, Google Analytics и аналогичные им можно применять и к оценке популярности веб-сайтов научных организаций. Решение вопроса выбора используемой системы полностью определяется набором рассматриваемых критериев. В том случае, если требуется анализировать большое число уникальных параметров (популярность статей научных журналов, наиболее активных пользователей, статистику анкетных данных зарегистрированных пользователей), целесообразнее разработать собственную систему. В том случае, когда оцениваются основные критерии посещаемости, полностью оправ-

14 Контент — информационное наполнение, информация, которая содержится на страницах веб-ресурса.

15 Коэффициент конверсии — отношение числа

посетителей, выполнивших целевое действие на сайте, к общему числу посетителей сайта.

дано использование сторонних сервисов Яндекс.Метрика, Google Analytics или подобных им.

При выборе системы сбора статистики посещения веб-сайтов, кроме анализа возможностей сервиса по оценке тех или иных критериев, возникает вопрос о сопоставимости результатов, получаемых с помощью разных приложений (можно ли считать данные одной системы верными или следует опираться на результаты другой). Далее в статье предлагается сравнить статистику посещения веб-сайтов организации (на примере интернет-портала ИСЭРТ РАН) с помощью трех различных систем, в качестве которых предлагается использовать сервисы Яндекс.Метрика, Google Analytics и систему сбора статистически данных, разработанную сотрудниками ИСЭРТ РАН.

Институт социально-экономического развития территорий РАН (ИСЭРТ РАН) существует с декабря 1990 года. Согласно Постановлению Президиума РАН № 96 от 31 марта 2009 года главной целью деятельности института определяется проведение фундаментальных исследований по шести основным направлениям, одним из которых является «Разработка проблем информатизации общества, интеллектуальные технологии в информационных и территориальных системах, науке и образовании» [6].

Первая версия сайта ИСЭРТ РАН была запущена в 2000 году [7]. На сегодняшний день весь пакет сайтов института объединен в единый интернет-портал, в состав которого на текущий момент входят главный сайт, сайты научных журналов ИСЭРТ РАН, сайты НОЦ16 и библиотеки, сайт типографии и предприятия «Территория инноваций». В 2014 году получено свидетельство о регистрации программы для ЭВМ на систему управления интернет-порталом [11].

16 НОЦ — научно-образовательный центр.

Можно отметить, что сбор статистической информации о посещаемости вебсайтов организации ведется в ИСЭРТ РАН с 1 января 2011 года. Стоит заметить, что с момента существования интернет-портала института на его страницах зарегистрировалось более 6000 пользователей.

При наполнении интернет-портала ИСЭРТ РАН особое внимание уделяется размещению полнотекстовых версий статей научных журналов и прочих материалов в формате PDF (полнотекстовых документов), учитываемых при ранжировании в вебометрических рейтингах.

С учетом международного опыта по открытости научных достижений обязательная для доступа к полнотекстовым версиям статей регистрация на страницах интернет-портала была отменена. Необходимо отметить, что отсутствие регистрации на страницах веб-сайтов научных журналов является обязательным требованием для попадания в базу DOAJ17 и присутствия в ней. Сегодня DOAJ — один из самых известных поисковых сервисов открытого типа в мире, насчитывающий более 10500 тысяч журналов более чем из 130 стран [15].

Результатом такого решения стал существенный рост просмотров страниц научных журналов, что привело к росту популярности всего интернет-портала в целом. Если в 2013 и 2014 годах среднемесячное количество просмотров страниц интернет-портала ИСЭРТ РАН составляло 28 и 35 тысяч соответственно, то в 2015 году этот показатель достиг 48 тысяч, таким образом, рост составил 71 и 37% по сравнению с результатами 2013 и 2014 годов соответственно.

Отмена обязательной регистрации для доступа к полнотекстовым версиям статей существенным образом повлияла на количество просмотров страниц ин-

17 DOAJ — директория журналов в открытом доступе.

тернет-портала, подсчитываемое с помощью собственной системы сбора статистической информации. Это объясняется учетом в системе просмотров полнотекстовых версий документов, которые доступны при переходе из поисковых систем по прямым ссылкам.

Следует отметить, что поиск и просмотр веб-страниц подобным образом является одним из самых быстрых и удобных для пользователя (он сразу получает доступ к интересующему его документу, в необходимом ему формате).

Однако следует обратить внимание, что при подсчете подобных просмотров поисковые системы могут использовать понятие отказа. Существуют различные подходы к его определению:

1. В Google Analytics отказом считается просмотр пользователем только одной страницы сайта за время визита.

2. В системе Яндекс.Метрика отказом считается визит, в рамках которого состоялся просмотр лишь одной страницы, продолжавшийся менее 15 секунд.

Учитывая вышесказанное, для сравнения предлагается брать число просмотров страниц интернет-портала без учета просмотров полнотекстовых документов (в существующей системе сбора статистики посещения веб-сайтов ИСЭРТ РАН такая возможность предусмотрена).

Если рассматривать количество просмотров страниц интернет-портала без учета полнотекстовых документов, можно отметить, что по сравнению с 2013 годом произошло снижение на 7%, а по сравнению с 2014 годом число просмотров выросло на 4% (количество просмотров страниц интернет-портала в 2013, 2014 и 2015 годах составляет 28, 25, 26 тысяч соответственно). В целом можно отметить, что показатель находится на примерно одном уровне, а по сравнению с 2014 годом наметилась незначительная положительная динамика.

Как отмечалось выше, интернет-портал ИСЭРТ РАН состоит из нескольких веб-сайтов, наиболее популярными из которых являются главный сайт института и сайты научных журналов. Привести в статье подробный анализ всех ресурсов интернет-портала не представляется возможным, поэтому предлагается рассмотреть в качестве объектов для сравнения главный сайт института, сайт научного журнала «Экономические и социальные перемены», а также сайт НОЦ. Анализ статистических данных будет проводиться за период с января по июнь 2015 года.

Суммарные результаты статистики просмотров страниц главного сайта интернет-портала за 6 месяцев говорят о том, что итоги по системе сбора статистических данных ИСЭРТ РАН (67437) превышают данные сервиса Яндекс.Метрика (64669) на 4%, а сервиса Google Analytics (63890) — на 5%, что говорит о сопоставимости в данном случае результатов, полученных с помощью разных систем.

Если рассматривать суммарное количество просмотров страниц сайта научного журнала «Экономические и социальные перемены» за период с января по июнь 2015 года, то система сбора статистических данных ИСЭРТ РАН отмечает 25651 просмотр, а сервисы Яндекс. Метрика и Google Analytics на 11 и 25% меньше (23125 и 19335 просмотров соответственно).

Объяснить эти результаты можно правилами подсчета отказов в различных системах. Наиболее популярными страницами сайтов научных журналов являются полнотекстовые версии публикаций, доступ к которым возможен и из поисковых систем по прямой ссылке, такие просмотры поисковыми системами могут рассматриваться как отказы и не учитываться при подсчете общего количества просмотров.

Если обратить внимание на статистику просмотров страниц сайта НОЦ за рассматриваемый период, то собственная система сбора статистических данных ИСЭРТ РАН отмечает 22570 просмотров, сервис Яндекс.Метрика — на 6,5% меньше (21201), а сервис Google Analytics — меньше на 22% (17518). Сокращение разницы между данными, полученными с помощью различных систем, объясняется меньшим количеством просмотров полнотекстовых документов, размещенных на страницах НОЦ, по сравнению с количеством просмотров на сайтах журналов.

Еще одним популярным для оценки критерием посещаемости веб-сайта является число уникальных пользователей сайта. Стоит отметить, что этот критерий неразрывно связан с числом просмотров страниц сайта и также зависит от правил просмотра полнотекстовых документов и учета отказов.

Если рассматривать число уникальных пользователей без учета просмотра полнотекстовых документов (при запрете просмотра без прохождения предварительной регистрации на сайте), то система сбора статистических данных ИСЭРТ РАН отмечает 81445 пользователей, в то время как с отсутствием регистрации и учетом просмотров полнотекстовых документов эта же система регистрирует 147377 пользователей, что на 81% больше. Это очень существенная разница, говорящая о том, что полнотекстовые документы пользуются очень большой популярностью и размещение их в открытом доступе способно значительно повысить популярность сайтов научной организации.

Учитывая подходы поисковых систем к подсчету отказов при просмотре страниц сайтов, можно предположить, что аналогичные правила действуют и при подсчете числа уникальных пользователей. Следовательно, для сравнения результатов различных систем сбора ста-

тистической информации необходимо использовать одинаковые подходы. Это относится и к системе сбора статистических данных ИСЭРТ РАН и потребовало изменения запросов к базе данных, что было реализовано сотрудниками лаборатории интеллектуальных и программно-информационных систем.

Если обратить внимание на количество уникальных пользователей главного сайта интернет-портала ИСЭРТ РАН за весь рассматриваемый период, то разница между количеством уникальных пользователей, подсчитанным системой сбора статистических данных ИСЭРТ РАН (12374 уникальных пользователей), и данными сервисов поисковых систем составляет 18% в случае сервиса Яндекс.Ме-трика (10156 уникальных пользователей) и 16,5% в случае сервиса Google Analytics (10333 уникальных пользователя).

Если брать в расчет данные по числу уникальных пользователей сайта научного журнала «Экономические и социальные перемены» за весь рассматриваемый период, то разница между количеством уникальных пользователей, подсчитанным системой сбора статистических данных ИСЭРТ РАН (6360 уникальных пользователей), и данными сервисов поисковых систем составляет 20% в случае сервиса Яндекс.Метрика (5103 уникальных пользователя) и 50% в случае сервиса Google Analytics (3191 уникальный пользователь).

Принимая во внимание все вышесказанные замечания относительно правил подсчета отказов, можно добавить, что причина такого существенного отличия может быть также связана с языковыми особенностями поисковых систем, осуществляющих индексацию страниц сайтов. Сервис Google Analytics специализируется на англоязычных сайтах, в то время как Яндекс.Метрика относится к русскоязычной зоне интернета.

Если брать в расчет количество уникальных пользователей сайта НОЦ интернет-портала ИСЭРТ РАН за весь рассматриваемый период, то разница между количеством уникальных пользователей, подсчитанным системой сбора статистических данных ИСЭРТ РАН (5759 уникальных пользователей), и данными сервисов поисковых систем составляет 20,5% в случае сервиса Яндекс.Метрика (4577 уникальных пользователей) и 38% в случае сервиса Google Analytics (3577 уникальных пользователей).

Обобщая все вышесказанное, стоит отметить, что полученная в ходе сравнения разница между данными, собранными с помощью различных систем сбора статистической информации, показывает, что на сегодняшний день (алгоритмы индексации поисковых систем постоянно модернизируются) можно говорить о близости результатов системы сбора статистической информации ИСЭРТ РАН и сервиса Яндекс.Метрика, в то время как сервис Google Analytics во многих случаях предоставляет существенно отличные результаты. Как уже отмечалось выше, это может быть связано с особенностями индексации им русскоязычных страниц веб-сайтов, в то время как Яндекс. Метрика изначально проектировался для русскоговорящего сегмента интернета. Кроме того, стоит обратить внимание на правила подсчета отказов и иметь ввиду, что наибольшей популярностью на страницах научных учреждений пользуются полнотекстовые версии документов, в том числе статьи научных журналов, доступ к которым возможен извне по прямой ссылке.

Стоит обратить внимание, что сегодня сотрудниками лаборатории интеллектуальных и программно-информационных систем ИСЭРТ РАН ведутся работы по модернизации существующего интернет-портала института, изменению

внешнего вида и переводу его на новую техническую платформу — фреймворк Yii2 [16]. Использование в качестве основы для построения системы управления интернет-порталом организации веб-ориентированных технологий, языка программирования PHP, фреймворка Yii2, паттернов проектирования позволит, опираясь на широкие возможности указанных решений, построить крос-сплатформенную многофункциональную систему с широкими возможностями по модернизации и интеграции с другими приложениями, а также коммуникации между пользователями [13].

Проведение анализа статистики посещения сайтов целесообразно рекомендовать всем академическим институтам без исключения. Это позволит сформировать и своевременно корректировать стратегию развития веб-сайтов научного института, что является необходимым для попадания в вебометрические рейтинги, повышения позиций в них, а также имеет значение при оценке результативности научного учреждения. Кроме того, вебсайт, имеющий высокие позиции в рейтингах, пользующийся популярностью среди исследователей будет привлекать к себе внимание, позволит институту «заявить о себе», что особенно важно для организаций, находящихся вне традиционных научных центров в регионах, будет способствовать развитию внешних, в том числе международных связей.

Обращая внимание на все вышесказанное, стоит отметить, что анализ статистики посещения веб-сайтов научной организации не способствует попаданию учреждения в вебометрические рейтинги, а направлен на выявление слабых, проблемных мест в структуре интернет-ресурсов институтов.

Если говорить о популярности вебсайтов, то необходимо особое внимание обращать на наполнение ресурсов акту-

альной, полезной для пользователей информацией, максимально представлять полнотекстовые документы, раскрывающие деятельность организации. Для научного учреждения это могут быть результаты исследований, участие в грантах, конкурсах, подготовленные публикации, монографии, информация о проводимых конференциях, семинарах, лекциях, в том числе с внешними коллегами. Особое внимание необходимо уделить увеличению числа ссылок на ресурсы веб-сайтов учреждения (в СМИ, на ресурсах конференций, сайтах партнеров, зарубежных базах научных публикаций и т.д.). Все это будет способствовать росту критериев оценки, учитываемых в вебометрических рейтингах, а соответственно и положения учреждения в них.

Результаты анализа популярности интернет-портала ИСЭРТ РАН способствовали принятию таких решений, как открытие свободного доступа к полнотекстовым версиям статей научных журналов института, размещение максимально возможного числа полнотекстовых документов на страницах ресурсов, перевод портала на новую техническую платформу. Принятые решения позволили существенно расширить аудиторию активных пользователей и число просматриваемых ими страниц, заложить основу для дальнейшего развития разнообразных сервисов, способствующих комфортному взаимодействию посетителей с веб-сайтами института.

Анализ статистики посещения вебсайтов ИСЭРТ РАН будет продолжаться и после внедрения нового интернет-портала, что позволит проанализировать результаты проведенной модернизации не только с субъективной точки зрения пользователей (нравится или нет), но и с применением вебометрических подходов. Исследования в данном направлении будут продолжены.

1. Вебометрический рейтинг Кибернетической лаборатории Центра научной информации и документации Национального исследовательского совета Испании [Электронный ресурс] / Cybermetrics Lab, Consejo Superior de Investigaciones Científicas. — Режим доступа : http://www.webometrics.info

2. Вебометрический рейтинг научных учреждений России [Электронный ресурс]. — Режим доступа : http://webometrics-net.ru

3. Гулин, К. А. Интернет-портал как средство популяризации деятельности научной организации [Текст] / К. А. Гулин, П. В. Скородумов // Проблемы развития территории. — 2015. — № 79.

4. Зеленин, А. С. Организация информационного пространства научного учреждения (на примере ИСЭРТ РАН) [Текст] / А. С. Зеленин // Проблемы развития территории. — 2012. — № 1 (57). — С. 119-127.

5. Кабакова, Е. А. Веб-сайт научно-исследовательского учреждения: наполнение, посетители, развитие [Электронный ресурс] / Е. А. Кабакова, В. С. Усков // Вопросы территориального развития. -2014. — № 3. — Режим доступа : http://vtr.vscc.ac.ru/article/1396/full

6. О переименовании Учреждения Российской академии наук Вологодского научно-координационного центра Центрального экономико-математического института РАН (представление Отделения общественных наук) [Электронный ресурс] : Постановление Президиума РАН № 96 от 31.03.2009. — Режим доступа : https://www.ras.ru/pres >

7. Официальный сайт Института социально-экономического развития территорий РАН [Электронный ресурс]. — Режим доступа : http://www.vscc.ac.ru

8. Официальный сайт компании Яндекс [Электронный ресурс]. — Режим доступа : https://metrika. yandex.ru/promo

9. Официальный сайт системы Google Analytics [Электронный ресурс]. — Режим доступа : http://www. google.com/intl/ru_ru/analytics/index.html

10. Проект плана реструктуризации научных организаций [Электронный ресурс]. — Режим доступа : http://fano.crowdexpert.ru/structurisation

11. Система управления интернет-порталом [Электронный ресурс] : Свидетельство № 2014612043 от 17.02.2014. — Режим доступа : http://www.vscc.ac.ru/storage/files/2014612043.pdf

12. Скородумов, П. В. Анализ подходов и инструментальных средств анализа статистики посещения веб-сайта научной организации [Электронный ресурс] / П. В. Скородумов, А. Ю. Холодев // Вопросы территориального развития. — 2015. — № 9. — Режим доступа : http://vtr.vscc.ac.ru/article/1650/full

13. Скородумов, П. В. Система управления проектами организации: анализ подходов и существующих программных решений [Текст] / П. В. Скородумов, Д. А. Баданин // Вопросы территориального развития. — 2015. — № 5.

14. Третьякова, О. В. Перспективы использования вебометрического анализа в оценке сайта научного института [Текст] / О. В. Третьякова, Е. А. Кабакова // Вопросы территориального развития. — 2014. — № 2.

15. DOAJ и JURN — поисковики по открытым журналам [Электронный ресурс]. — Режим доступа : http://elibrary.ru/projects/blogs/post/2015/06/16/oa3.aspx

16. Yii framework [Electronic resource]. — Available at : http://www.yiiframework.com

ИНФОРМАЦИЯ ОБ АВТОРАХ

Скородумов Павел Валерьевич — кандидат технических наук, заведующий лабораторией интеллектуальных и программно-информационных систем отдела проблем научно-технологического развития и экономики знаний. Федеральное государственное бюджетное учреждение науки Институт социально-экономического развития территорий Российской академии наук. Россия, 160014, г. Вологда, ул. Горького, д. 56а. E-mail: spv.vscc@gmail.com. Тел.: (8172) 59-78-10.

Холодев Александр Юрьевич — инженер-исследователь лаборатории интеллектуальных и программно-информационных систем отдела проблем научно-технологического развития и экономики знаний. Федеральное государственное бюджетное учреждение науки Институт социально-экономического развития территорий Российской академии наук. Россия, 160014, г. Вологда, ул. Горького, д. 56а. E-mail: der.goodwin@ya.ru. Тел.: (8172) 59-78-10.

Skorodumov P.V., Kholodev A. Yu.

ANALYSIS OF THE SCIENTIFIC ORGANIZATION WEBSITE POPULARITY BY MEANS OF DIFFERENT SYSTEMS FOR COLLECTING STATISTICS

The increasing popularity of web applications and the Internet is associated with the modern level of information technologies development. Websites play a significant role in the development of modern organizations, as they have extensive functionality and help automate and improve many conducted processes. Scientific organizations also pay close attention to the support, development and promotion of own websites. This is caused by the fact that the number of mentions about an organization in the media and the attendance of official websites on the Internet are included in the project of the system to evaluate the performance of a scientific organization proposed by the Ministry of Education and Science of the Russian Federation and taken into account in the assessment of the activities of a scientific institution. This is particularly important in connection with the ongoing reform of academic science, namely, the reorganization and transition to competitive financing of scientific institutions, as well as with the desire to expand international scientific cooperation and include Russian universities and research centers in foreign databases and ratings. Thus, to date, the website does not only serve as a platform for posting information, but also contributes to the formation of single information space uniting numerous web resources that reflect a wide range of activities of scientific institutions. Taking into account the importance that webometric rankings have today, paying attention to the role of search engines in determining the rank of an organization, to analyze the popularity of a website one should pay attention to statistical data obtained by means of different systems. The article substantiates the necessity to assess the popularity of the website of a scientific organization, including with the help of different systems for collecting statistical information. It identifies the approaches to the collection of statistical data. It touches upon services, such as YandexMetrica and Google Analytics, and their capabilities. The paper shows the analysis of the popularity of the Internet portal of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences by criteria, such as a number of page views and a number of unique users. It considers statistical data on the main Institute’s website, the website of the scientific journal «Economic and Social Changes: Facts, Trends, Forecast», the Research-Educational Center of Economics and Information Technology of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences. It presents the comparison of statistical data and possible reasons for the differences. In conclusion it summarizes results of the analysis. It mentions features of counting the statistics of website attendance by various services, the need for such an analysis, the usefulness of upgrading the existing Internet portal of the Institute of Socio-Economic Development of Territories of the Russian Academy of Sciences and continuing research in this area.

Website research of a scientific organization, attendance statistics, system of collection and analysis of website attendance statistics.

1. Vebometricheskii reiting Kiberneticheskoi laboratorii Tsentra nauchnoi informatsii i dokumentatsii Nat-sional’nogo issledovatel’skogo soveta Ispanii [Webometrics rank of a Cybernetic Laboratory of the Center for Scientific Information and Documentation of the National Research Council of Spain]. Available at : http://www.webometrics.info

2. Vebometricheskii reiting nauchnykh uchrezhdenii Rossii [Webometrics ranking of research institutions in Russia]. Available at : http://webometrics-net.ru

3. Gulin K. A., Skorodumov P. V. Internet-portal kak sredstvo populyarizatsii deyatel’nosti nauchnoi organi-zatsii [Internet portal as a means of promoting the activities of scientific organizations]. Problemy razvi-tiya territorii [Problems of territory’s development], 2015, no. 79.

4. Zelenin A. S. Organizatsiya informatsionnogo prostranstva nauchnogo uchrezhdeniya (na primere ISERT RAN) [Organization of information space of scientific institutions (on the example of ISEDT RAS)]. Problemy razvitiya territorii [Problems of territory’s development], 2012, no. 1 (57), pp. 119-127.

5. Kabakova E. A., Uskov V. S. Veb-sait nauchno-issledovatel’skogo uchrezhdeniya: napolnenie, posetite-li, razvitie [Website of a research institution: content, visitors, and development]. Voprosy territori-al’nogo razvitiya [Issues of territorial development], 2014, no. 3. Available at : http://vtr.vscc.ac.ru/ article/1396/full

6. O pereimenovanii Uchrezhdeniya Rossiiskoi akademii nauk Vologodskogo nauchno-koordinatsionnogo tsentra Tsentral’nogo ekonomiko-matematicheskogo instituta RAN (predstavlenie Otdeleniya obshchest-vennykh nauk) : Postanovlenie Prez >

7. Ofitsial’nyi sait Instituta sotsial’no-ekonomicheskogo razvitiya territorii RAN [Official website of the Institute of Socio-Economic Development of Territories of RAS]. Available at : http://www.vscc.ac.ru

8. Ofitsial’nyi sait kompanii Yandeks [Official website of the company Yandex]. Available at : https://metrika. yandex.ru/promo

9. Ofitsial’nyi sait sistemy Google Analytics [Official website of Google Analytics]. Available at : http://www. google.com/intl/ru_ru/analytics/index.html

10. Proekt plana restrukturizatsii nauchnykh organizatsii [Draft plan of restructuring of scientific organizations]. Available at : http://fano.crowdexpert.ru/structurisation

11. Sistema upravleniya internet-portalom : Svidetel’stvo № 2014612043 ot 17.02.2014 [Management system of a web portal : Certificate No. 2014612043 of February 17, 2014]. Available at : http://www.vscc.ac.ru/ storage/files/2014612043.pdf

12. Skorodumov P. V., Kholodev A. Yu. Analiz podkhodov i instrumental’nykh sredstv analiza statistiki pose-shcheniya veb-saita nauchnoi organizatsii [Analysis of approaches and tools to analyze the statistics of visits to the web site of scientific organizations]. Voprosy territorial’nogo razvitiya [Issues of territorial development], 2015, no. 9. Available at : http://vtr.vscc.ac.ru/article/1650/full

13. Skorodumov P. V., Badanin D. A. Sistema upravleniya proektami organizatsii: analiz podkhodov i sush-chestvuyushchikh programmnykh reshenii [Organization projects management system: analysis of existing approaches and software solutions]. Voprosy territorial’nogo razvitiya [Issues of territorial development], 2015, no. 5.

14. Tret’yakova O. V., Kabakova E. A. Perspektivy ispol’zovaniya vebometricheskogo analiza v otsenke saita nauchnogo instituta [Prospects for the use of webometric analysis in the evaluation of a research institute website]. Voprosy territorial’nogo razvitiya [Issues of territorial development], 2014, no. 2.

Мастер Йода рекомендует:  Спецификация и функции DOM в PHP
Добавить комментарий