Дубль гис статистика. Гис - геоинформационная система статистики

Пространственно-временная статистика

Возможности и преимущества ГИС-статистики

Методы и процедуры статистического анализа и моделирования широко используются в географических исследованиях в силу стохастической природы многих географических явлений, как природных, так и социально-экономических. Наряду с использованием стандартных непространственных статистических алгоритмов и процедур, в настоящее время в географии получают широкое распространение методы нового раздела математической статистики - Пространственной статистики или Геостатистики .

Какие особенности имеет и что нового дает статистическое моделирование и анализ в среде ГИС?

Одним из главных преимуществ ГИС-статистики являются богатые возможности визуализации процесса статистического моделирования на всех его этапах, начиная с отбора необходимых для анализа географических объектов, интерактивного графического представления промежуточных результатов в виде различных компьютерных диаграмм и динамически связанных "окон", и кончая сложными 3-х мерными изображениями геостатистических поверхностей и объемов. Таким образом, создается информационная среда, в которой исследователю намного легче принимать решения в процессе статистического моделирования и анализа географических явлений.

Следует отметить, что. в настоящее время существует определенный дефицит средств статистического моделирования в ГИС. Так, например, популярные коммерческие ГИС-пакеты ARC/INFO, SPANS и GENAMAP обеспечивают довольно ограниченный круг статистического анализа низшего уровня (дескриптивная статистика), включая расчет базовых статистических показателей, преобразование данных и простейшую статграфику. С другой стороны, в этих пакетах реализованы макроязыки, позволяющие пользователю разрабатывать собственные статистические модули. К сожалению, отсутствие интерфейса высокого уровня для доступа к базе данных ГИС и статистической графике делает эти языки недостаточно эффективными. Исключением является модуль статистического анализа SAM, состоящий из комплекса программ, написанных на языке С. Этот модуль функционирует в среде ARC/INFO и предполагает использование макроязыка AML.

Особого внимания заслуживает язык статистического программирования S-Plus, использование которого в ГИС значительно расширяет возможности геостатистического моделирования благодаря применению динамического "оконного" интерфейса и компьютерной графики.

Другим направлением развития ГИС-статистики является разработка интерфейса, обеспечивающего возможность более тесного соединения коммерческих ГИС-пакетов со стандартными статистическими пакетами, например MINITAB, SPSS, SAS и другими. При этом для экспорта необходимых файлов из ГИС используется, как правило, формат ASCII.

Альтернативным к перечисленным выше представляется подход, при котором в стандартные статистические пакеты добавляются функции ГИС. Например, современные версии пакета SPSS обладают способностью строить тематические карты, хотя до реализации полноценных пространственных функций ГИС дело здесь пока не дошло.

Пространственно-временная статистика в IDRISI

В качестве примера ГИС-реализации методов пространственно-временной статистики рассмотрим статистический блок пакета IDRISI. Следует отметить, что в этом популярном растровом ГИС-пакете, пожалуй, наиболее полно представлен спектр методов статистического моделирования, что, наряду с доступностью и простотой освоения, делает его в некотором смысле уникальным.

Всю совокупность методов, включенных в статистический блок IDRISI, условно можно разделить на две группы: непространственной и пространственной статистики. Основное различие между ними состоит в том, что методы и процедуры пространственной статистики учитывают в явном виде пространственные отношения объектов геоизображения (соседство и близость растровых ячеек), в то время как непространственная статистика этих отношений не рассматривает, ограничиваясь простыми группировками атрибутивных данных, привязанных к растровым ячейкам.

В группу Непространственной статистики пакета IDRISI входят следующие процедуры:

HISTO-построение гистограммы частотного распределения числовых величин ячеек геоизображения. Данная процедура включает расчет ряда статистических параметров распределения: математического ожидания и стандартного отклонения значений атрибутивного признака в пределах всего изображения. Итоговая информация может быть представлена в графической и числовой форме. В первом случае на экран выводится общий график гистограммы, а во втором - числовая (частотная) характеристика каждого класса (интервала) значений в кумулятивной, пропорциональной и кумулятивно-пропорциональной формах представления частот распределения.

EXTRACT-процедура, обеспечивающая получение суммарных статистических характеристик выбранных объектов (совокупности ячеек определенного типа) геоизображения. При этом итоговые статистические показатели могут быть представлены на экране в виде таблицы, либо сохранены в виде отдельного файла. В число рассчитываемых параметров входят: минимум, максимум, общая сумма, среднее арифметическое, стандартное отклонение и другие.

REGRESS-регрессионный анализ двух геоизображений (или двух соответствующих атрибутивных файлов). В результате процедуры на экран выводится диаграмма распределения (корреляционное поле), график линии тренда, а также таблица статистических характеристик регрессии: уравнение регрессии, коэффициент корреляции и соответствующие показатели значимости.

CROSSTAB-качественный аналог регрессионного анализа, позволяющий выявить статистическую зависимость двух геоизображений, атрибутивные признаки которых измерены в качественных шкалах (порядковой или номинальной). Главным результатом этой процедуры является таблица сопряженности, отражающая частоту встречаемости парных комбинаций различных категорий (значений качественных признаков) сравниваемых геоизображений. Одновременно рассчитываются качественные аналоги показателей статистической зависимости и соответствующие им параметры: показатели "ху-квадрат" Крамера, число степеней свободы и другие. Кроме того, CROSSTAB обеспечивает возможность создания нового результативного (комбинированного) геоизображения, категории которого представляют собой парные комбинации категорий исходных совмещенных геоизображений (как результат выполнения логической функции AND).

RANDOM-генерирование и построение случайных гипотетических геоизображений на основе статистических моделей распределения (нормального и прямолинейного) с заданными параметрами распределения (математическим ожиданием и стандартным отклонением). Данная процедура может быть использована для построения стохастической поверхности с целью оценки вероятности появления определенных событий.

Группа процедур пространственной статистики пакета IDRISI включает:

TREND-процедура, представляющая собой пространственный аналог процедуры REGRESS. С ее помощью определяется и строится трендовая регрессионная поверхность в X-Y координатах, заданных на растровом геоизображении. Возможна реализация трех видов регрессионного полинома: линейного, квадратического и кубического. Данная процедура используется в сдучае, когда необходимо выявить наличие сколько-нибудь существенного пространственного тренда в распределении значений атрибутивного признака в пределах данного геоизображения с целью интерполяции и объяснения.

AUTOCORR-расчет коэффициента пространственной автокорреляции с использованием "I" статистики Морана. При этом в автокорреляционный анализ может быть включено все геоизображение целиком, либо его отдельные части. Данная процедура позволяет выявить наличие пространственной зависимости в распределении значений атрибутивного признака растрового геоизображения.

CENTER-расчет среднего центра (взвешенного или невзвешенного) и стандартного радиуса для множества точек геоизображения. Средний центр может рассматриваться как "центр тяжести" данной группы точек, в то время как стандартный радиус является прямой аналогией стандартного отклонения для непространственных данных и используется в качестве показателя пространственной дисперсии (разброса) точек от их наиболее вероятного положения.

QUADRAT-процедура, используемая для определения характера размещения точек, т. н. "точечного образа". Последний может быть регулярным, случайным или кластеризующимся. Одним из результатов данной процедуры является расчет отношения показателя вариации к математическому ожиданию, что может служить критерием выбора одного из 3-х перечисленных вариантов. Кроме того, QUADRAT рассчитывает плотность размещения точек геоизображения.

PATTERN-процедура, расширяющая возможности предыдущей с помощью расчета различных количественных мер на основе сравнения фиксированной ячейки с соседними. В число этих мер входят показатели относительной доступности, распространенности, доминирования, фрагментации и некоторые другие. Все они оказываются полезными, например, в исследовании морфологической структуры ландшафта.

CRATIO-расчет степени компактности выделенного полигона. При этом отношение "площадь/периметр", рассчитанное для данного полигона, сравнивается с таким же отношением для круга, как наиболее компактной геометрической фигуры.

PROFILE-расчет и построение пространственных и временных профилей. В результате получается графический образ профиля, который может быть сохранен для дальнейшего анализа в виде отдельного файла.

SAMPLE-генерирование векторного файла точек в соответствии с выбранной схемой пространственного отбора: систематической, случайной или стратифицированно-случайной. Эта процедура может быть использована при решении задачи оценки точности измерений, а также в процессе пространственного отбора точек для дальнейшего исследования.

Версия 4.1 пакета IDRISI содержит модуль Пространственно-временной статистики TSA, который реализует один из методов факторного анализа - метод главных компонент, - в процессе изучения динамики изменения растровых геоизображений, рассматриваемых в качестве элементов временного ряда. В результате работы модуля TSA пользователь получает "сжатую" пространственно-временную информацию о тенденциях и аномалиях изменения геоизображения в течение определенного промежутка времени. При этом рассматриваются, как правило, длинные временные ряды (более 20 наблюдений), так как собственно "факторизация" осуществляется на множестве разновременных геоизображений. Путем расчета компонент ("факторов") разного порядка и построения соответствующих им геоизображений, .удается выявить тонкие закономерности и аномалии пространственно-временной динамики географических явлений.

ГИС-статистика - 5.0 out of 5 based on 1 vote

«Статистика 2ГИС» предназначена для широкой аудитории, но в первую очередь будет интересна тем, кому для работы необходимы объективные данные о городах. Например, журналистам, готовящим материалы об инфраструктуре города, предпринимателям, изучающим развитость конкретной отрасли экономики в регионе, студентам, готовящим исследовательскую работу и т.д. Статистика формируется на основе справочников 2ГИС, которые уточняются и обновляются специалистами компании ежемесячно, а в ряде городов – ежедневно.

Компания 2ГИС

Российская компания 2ГИС выпускает одноименные электронные справочники с картами городов. Первый выпуск 2ГИС вышел в 1999 году, сегодня продукт охватывает более 180 городов в России, а также несколько городов за рубежом (в Италии, Украине и Казахстане). Справочник 2ГИС доступен в трех версиях: для ПК, мобильных устройств с операционными системами iOS, Android, Windows Mobile, Symbian и в виде онлайн-сервиса на maps.2gis.ru. Все продукты 2ГИС бесплатны для пользователей и в каждом городе обновляются ежемесячно (онлайн-версия – ежедневно в ряде крупных городов). Аудитория пользователей ПК-версии 2ГИС составляет более 13 млн человек, мобильной версии – 2,5 млн человек, онлайн-версии – 1,5 млн уникальных посетителей ежемесячно.

Пользоваться сервисом очень просто. Нужно лишь указать интересующие сферы деятельности и города. В результате можно будет увидеть сравнение этих городов по общему количеству организаций (с учетом филиалов) в указанной сфере, а также по их числу в пересчете на 100 тыс. жителей – так проще сравнивать города разных масштабов. Всего «Статистика 2ГИС» содержит данные более чем о 80 сферах деятельности в 70 городах России (многие крупные города учтены со спутниками). В ближайшей перспективе на stat.2gis.ru появится возможность проследить развитие интересующих сфер в городах в помесячной динамике.

Например, по данным 2ГИС, самый обеспеченный банкоматами город России – это Сочи. В столице ближайшей Олимпиады 159 банкоматов на 100 тыс. жителей . Москва в этом рейтинге лишь на 54 месте – 81 банкомат на 100 тыс. жителей. А среди городов-миллионников по этому показателю на первом месте Казань (136).

Впрочем, если рассматривать абсолютное количество фирм, то Москва, как крупнейший город России, лидирует практически везде. В частности, столица не знает равных по числу бизнес-центров (здесь их 908). На втором месте Санкт-Петербург (513), а далее в первой пятерке, но с большим отрывом от лидеров, следуют Нижний Новгород (86), Новосибирск (82) и Екатеринбург (70). Зато в пересчете на население самым обеспеченным бизнес-центрами городом страны является Санкт-Петербург – в северной столице 11 бизнес-центров на 100 тыс. жителей.

Пользоваться « » можно совершенно бесплатно, при публикации данных сервиса в СМИ или в интернете необходима ссылка на 2ГИС.

Сервис статистики создан и работает на API 2ГИС , с помощью этого инструмента любой интернет-ресурс может бесплатно использовать карты и справочные данные 2ГИС.

Материал предоставлен пресс-службой 2ГИС.

"Interest in the company area of activity" report

The "Search" chart shows how many queries for a category of the directory 2GIS users made during the selected period. The report is available only for categories of the company.

"Search queries" report


This is the top of search queries that users entered to open the company website. You can generate a report per month and per year. A report for the next month is availble on the 2nd of the following month.

"Position in search results and impressions of a company card" report


The number of impressions in the search results depends on a company position. The higher the position is, the more impressions a company gets. For example, with the "Cafes and restaurants" query, the maximum number of impressions will be received by a company, which is situated on the first place in the "Cafes and restaurants" category. The report shows both figures and the relationship between them by days, weeks and months.

The impressions – all impressions of a company page. Also considered as new impressions are: the impression of the second (and every next) branch in the search; the impression of a card in the map area by moving the cursor over the point; the impression in the search results without a query (for example, after clicking on the "Service companies" link in a building card), etc. This is how the "Impressions" metric is different from "Impessions in search results", which takes into account the unique impressions of a company in the search results of the directory in response to the query in a category.

The impressions forecast shows the forecast number of impressions that the company will get if it places its advertisement and occupies the first position in a category. In the report settings you can select a forecast for several days and for the whole month. The forecast in 2GIS Business Account is available to companies that are currently not being advertised. If you are an advertiser, please contact your Personal Manager to receive the forecast. The manager will provide a forecast based on your advertising placement parameters.

"Competition in the category" report


The "Dependence of impressions on the position in the search results" diagram shows how many impressions a company of the selected area of activity receives on average, if it is on the 1st, 2nd, etc. place in a category. The companies located on the two top positions in the search results are also displayed in the "Offers of other companies" block on the pages of your competitors. The impressions on the pages of competitors are displayed in dark grey in the two top columns of the diagram.

"Clicks on the company page and actions on it" report


The report shows the number of impressions of a company page and the total number of actions which users perform on it: views of contacts, photos, discounts, etc. The number of actions per one page view shows the level of user involvement. The involvement, among other things, depends on the amount of useful information. So that the page visitors could learn more about your company, we advise you to post photos, discounts and full description of services. The report is available only to advertisers.

"Contacts with the company" report


Calls, clicks on the company address and on the company website, i.e. the most important actions performed by visitors on the page, that bring customes to the company. The data is given dynamically for different periods. The report is available only to advertisers.

"Actions on the page for the last month" report


2ГИС представляет новый онлайн-сервис stat.2 gis.ru , который позволяет сравнивать города по развитию более 80 сфер экономики. В его основе - данные о количестве предприятий из регулярно обновляемых справочников 2ГИС.

"Статистика 2ГИС" предназначена для широкой аудитории, но в первую очередь будет интересна тем, кому для работы необходимы объективные данные о городах. Например, журналистам, готовящим материалы об инфраструктуре города, предпринимателям, изучающим развитость конкретной отрасли экономики в регионе, студентам, готовящим исследовательскую работу и т.д. Статистика формируется на основе справочников 2ГИС, которые уточняются и обновляются специалистами компании ежемесячно, а в ряде городов - ежедневно.

Пользоваться сервисом очень просто. Нужно лишь указать интересующие сферы деятельности и города. В результате можно будет увидеть сравнение этих городов по общему количеству организаций (с учетом филиалов) в указанной сфере, а также по их числу в пересчете на 100 тыс. жителей - так проще сравнивать города разных масштабов. Всего "Статистика 2ГИС" содержит данные более чем о 80 сферах деятельности в 70 городах России (многие крупные города учтены со спутниками). В ближайшей перспективе на stat.2gis.ru появится возможность проследить развитие интересующих сфер в городах в помесячной динамике.

Например, по данным 2ГИС, самый обеспеченный банкоматами город России - это Сочи. В столице ближайшей Олимпиады 159 банкоматов на 100 тыс. жителей . Москва в этом рейтинге лишь на 54 месте - 81 банкомат на 100 тыс. жителей. А среди городов-миллионников по этому показателю на первом месте Казань (136).

Впрочем, если рассматривать абсолютное количество фирм, то Москва, как крупнейший город России, лидирует практически везде. В частности, столица не знает равных по числу бизнес-центров (здесь их 908). На втором месте Санкт-Петербург (513), а далее в первой пятерке, но с большим отрывом от лидеров, следуют Нижний Новгород (86), Новосибирск (82) и Екатеринбург (70). Зато в пересчете на население самым обеспеченным бизнес-центрами городом страны является Санкт-Петербург - в северной столице 11 бизнес-центров на 100 тыс. жителей.

Пользоваться "Статистикой 2ГИС " можно совершенно бесплатно, при публикации данных сервиса в СМИ или в интернете необходима ссылка на 2ГИС.

Сервис статистики создан и работает на API 2ГИС , с помощью этого инструмента любой интернет-ресурс может бесплатно использовать карты и справочные данные 2ГИС.