Среднее значение по каждому. Метод средних величин, теория

В процессе изучения математики школьники знакомятся с понятием среднего арифметического. В дальнейшем в статистике и некоторых других науках студенты сталкиваются и с вычислением других Какими они могут быть и чем отличаются друг от друга?

смысл и различия

Не всегда точные показатели дают понимание ситуации. Для того чтобы оценить ту или иную обстановку, нужно подчас анализировать огромное количество цифр. И тогда на помощь приходят средние значения. Именно они позволяют оценить ситуацию в общем и целом.

Со школьных времен многие взрослые помнят о существовании среднего арифметического. Его очень просто вычислить - сумма последовательности из n членов делится на n. То есть если нужно вычислить среднее арифметическое в последовательности значений 27, 22, 34 и 37, то необходимо решить выражение (27+22+34+37)/4, поскольку в расчетах используется 4 значения. В данном случае искомая величина будет равна 30.

Часто в рамках школьного курса изучают и среднее геометрическое. Расчет данного значения базируется на извлечении корня n-ной степени из произведения n-членов. Если брать те же числа: 27, 22, 34 и 37, то результат вычислений будет равен 29,4.

Среднее гармоническое в общеобразовательной школе обычно не является предметом изучения. Тем не менее оно используется довольно часто. Эта величина обратна среднему арифметическому и рассчитывается как частное от n - количества значений и суммы 1/a 1 +1/a 2 +...+1/a n . Если снова брать тот же для расчета, то гармоническое составит 29,6.

Средневзвешенное значение: особенности

Однако все вышеперечисленные величины могут быть использованы не везде. Например, в статистике при расчете некоторых важную роль имеет "вес" каждого числа, используемого в вычислениях. Результаты являются более показательными и корректными, поскольку учитывают больше информации. Эта группа величин носит общее название "средневзвешенное значение". Их в школе не проходят, поэтому на них стоит остановиться поподробнее.

Прежде всего, стоит рассказать, что подразумевается под "весом" того или иного значения. Проще всего объяснить это на конкретном примере. Два раза в день в больнице происходит замер температуры тела у каждого пациента. Из 100 больных в разных отделениях госпиталя у 44 будет нормальная температура - 36,6 градусов. У еще 30 будет повышенное значение - 37,2, у 14 - 38, у 7 - 38,5, у 3 - 39, и у двух оставшихся - 40. И если брать среднее арифметическое, то эта величина в общем по больнице будет составлять больше 38 градусов! А ведь почти у половины пациентов совершенно И здесь корректнее будет использовать средневзвешенное значение, а "весом" каждой величины будет количество людей. В этом случае результатом расчета будет 37,25 градусов. Разница очевидна.

В случае средневзвешенных расчетов за "вес" может быть принято количество отгрузок, число работающих в тот или иной день людей, в общем, все что угодно, что может быть измерено и повлиять на конечный результат.

Разновидности

Средневзвешенное значение соотносится со средним арифметическим, рассмотренным в начале статьи. Однако первая величина, как уже было сказано, учитывает также вес каждого числа, использованного в расчетах. Помимо этого существуют также средневзвешенное геометрическое и гармоническое значения.

Имеется еще одна интересная разновидность, используемая в рядах чисел. Речь идет о взвешенном скользящем среднем значении. Именно на его основе рассчитываются тренды. Помимо самих значений и их веса там также используется периодичность. И при вычислении среднего значения в какой-то момент времени также учитываются величины за предыдущие временные отрезки.

Расчет всех этих значений не так уж и сложен, однако на практике обычно используется только обычное средневзвешенное значение.

Способы расчета

В век повальной компьютеризации нет необходимости вычислять средневзвешенное значение вручную. Однако нелишним будет знать формулу расчета, чтобы можно было проверить и при необходимости откорректировать полученные результаты.

Проще всего будет рассмотреть вычисление на конкретном примере.

Необходимо узнать, какая же средняя оплата труда на этом предприятии с учетом количества рабочих, получающих тот или иной заработок.

Итак, расчет средневзвешенного значения производится с помощью такой формулы:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Для примера же вычисление будет таким:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Очевидно, что нет особых сложностей с тем, чтобы вручную рассчитать средневзвешенное значение. Формула же для вычисления этой величины в одном из самых популярных приложений с формулами - Excel - выглядит как функция СУММПРОИЗВ (ряд чисел; ряд весов)/СУММ (ряд весов).

В процессе различных расчетов и работы с данными довольно часто требуется подсчитать их среднее значение. Оно рассчитывается путем сложения чисел и деления общей суммы на их количество. Давайте выясним, как вычислить среднее значение набора чисел при помощи программы Microsoft Excel различными способами.

Самый простой и известный способ найти среднее арифметическое набора чисел — это воспользоваться специальной кнопкой на ленте Microsoft Excel. Выделяем диапазон чисел, расположенных в столбце или в строке документа. Находясь во вкладке «Главная», жмем на кнопку «Автосумма», которая расположена на ленте в блоке инструментов «Редактирование». Из выпадающее списка выбираем пункт «Среднее».

После этого, с помощью функции «СРЗНАЧ», производится расчет. В ячейку под выделенным столбцом, или справа от выделенной строки, выводится средняя арифметическая данного набора чисел.

Этот способ хорош простотой и удобством. Но, у него имеются и существенные недостатки. С помощью этого способа можно произвести подсчет среднего значения только тех чисел, которые располагаются в ряд в одном столбце, или в одной строке. А вот, с массивом ячеек, или с разрозненными ячейками на листе, с помощью этого способа работать нельзя.

Например, если выделить два столбца, и вышеописанным способом вычислить среднее арифметическое, то ответ будет дан для каждого столбца в отдельности, а не для всего массива ячеек.

Вычисление с помощью Мастера функций

Для случаев, когда нужно подсчитать среднюю арифметическую массива ячеек, или разрозненных ячеек, можно использовать Мастер функций. Он применяет все ту же функцию «СРЗНАЧ», известную нам по первому методу вычисления, но делает это несколько другим способом.

Кликаем по ячейке, где хотим, чтобы выводился результат подсчета среднего значения. Жмем на кнопку «Вставить функцию», которая размещена слева от строки формул. Либо же, набираем на клавиатуре комбинацию Shift+F3.

Запускается Мастер функций. В списке представленных функций ищем «СРЗНАЧ». Выделяем его, и жмем на кнопку «OK».

Открывается окно аргументов данной функции. В поля «Число» вводятся аргументы функции. Это могут быть как обычные числа, так и адреса ячеек, где эти числа расположены. Если вам неудобно вводить адреса ячеек вручную, то следует нажать на кнопку расположенную справа от поля ввода данных.

После этого, окно аргументов функции свернется, а вы сможете выделить ту группу ячеек на листе, которую берете для расчета. Затем, опять нажимаете на кнопку слева от поля ввода данных, чтобы вернуться в окно аргументов функции.

Если вы хотите подсчитать среднее арифметическое между числами, находящимися в разрозненных группах ячеек, то те же самые действия, о которых говорилось выше, проделывайте в поле «Число 2». И так до тех пор, пока все нужные группы ячеек не будут выделены.

После этого, жмите на кнопку «OK».

Результат расчета среднего арифметического будет выделен в ту ячейку, которую вы выделили перед запуском Мастера функций.

Панель формул

Существует ещё третий способ запустить функцию «СРЗНАЧ». Для этого, переходим во вкладку «Формулы». Выделяем ячейку, в которой будет выводиться результат. После этого, в группе инструментов «Библиотека функций» на ленте жмем на кнопку «Другие функции». Появляется список, в котором нужно последовательно перейти по пунктам «Статистические» и «СРЗНАЧ».

Затем, запускается точно такое же окно аргументов функции, как и при использовании Мастера функций, работу в котором мы подробно описали выше.

Дальнейшие действия точно такие же.

Ручной ввод функции

Но, не забывайте, что всегда при желании можно ввести функцию «СРЗНАЧ» вручную. Она будет иметь следующий шаблон: «=СРЗНАЧ(адрес_диапазона_ячеек(число); адрес_диапазона_ячеек(число)).

Конечно, этот способ не такой удобный, как предыдущие, и требует держать в голове пользователя определенные формулы, но он более гибкий.

Расчет среднего значения по условию

Кроме обычного расчета среднего значения, имеется возможность подсчета среднего значения по условию. В этом случае, в расчет будут браться только те числа из выбранного диапазона, которые соответствуют определенному условию. Например, если эти числа больше или меньше конкретно установленного значения.

Для этих целей, используется функция «СРЗНАЧЕСЛИ». Как и функцию «СРЗНАЧ», запустить её можно через Мастер функций, из панели формул, или при помощи ручного ввода в ячейку. После того, как открылось окно аргументов функции, нужно ввести её параметры. В поле «Диапазон» вводим диапазон ячеек, значения которых будут участвовать в определении среднего арифметического числа. Делаем это тем же способом, как и с функцией «СРЗНАЧ».

А вот, в поле «Условие» мы должны указать конкретное значение, числа больше или меньше которого будут участвовать в расчете. Это можно сделать при помощи знаков сравнения. Например, мы взяли выражение «>=15000». То есть, для расчета будут браться только ячейки диапазона, в которых находятся числа большие или равные 15000. При необходимости, вместо конкретного числа, тут можно указать адрес ячейки, в которой расположено соответствующее число.

Поле «Диапазон усреднения» не обязательно для заполнения. Ввод в него данных является обязательным только при использовании ячеек с текстовым содержимым.

Когда все данные введены, жмем на кнопку «OK».

После этого, в предварительно выбранную ячейку выводится результат расчета среднего арифметического числа для выбранного диапазона, за исключением ячеек, данные которых не отвечают условиям.

Как видим, в программе Microsoft Excel существует целый ряд инструментов, с помощью которых можно рассчитать среднее значение выбранного ряда чисел. Более того, существует функция, которая автоматически отбирает числа из диапазона, не соответствующие заранее установленному пользователем критерию. Это делает вычисления в приложении Microsoft Excel ещё более удобными для пользователей.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Каждый человек в современном мире, планируя взять кредит или делая запасы овощей на зиму, периодически сталкивает с таким понятием, как «средняя величина». Давайте узнаем: что это такое, какие ее виды и классы существуют и зачем она применяется в статистике и других дисциплинах.

Средняя величина - это что такое?

Подобное название (СВ) носит обобщенная характеристика совокупности однородных явлений, определяемая по какому-либо одному количественному варьируемому признаку.

Однако люди далекие, от столь заумных определений, понимают это понятие, как среднее количество чего-то. Например, прежде чем взять кредит, сотрудник банка обязательно попросит потенциального клиента предоставить данные о среднем доходе за год, то есть общую сумму зарабатываемых человеком средств. Она вычисляется путем суммирования заработанного за весь год и разделения на количество месяцев. Таким образом, банк сможет определить, сумеет ли его клиент отдать долг в срок.

Зачем она используется?

Как правило, средние величины широко применяются для того, чтобы дать итоговую характеристику определенных общественных явлений, носящих массовый характер. Также они могут быть использованы для менее масштабных расчетов, как в случае с кредитом, в приведенном выше примере.

Однако чаще всего средние величины все же применяются для глобальных целей. В качестве примера одного из них можно привести вычисление количества потребляемой гражданами электроэнергии на протяжении одного календарного месяца. На основе полученных данных в дальнейшем устанавливаются максимальные нормы для категорий населения, пользующихся льготами от государства.

Также с помощью средних величин разрабатывается гарантийный срок службы тех или иных бытовых приборов, автомобилей, зданий и т. п. На основе собранных таким способом данных когда-то были разработаны современные нормы труда и отдыха.

Фактически любое явление современной жизни, носящее массовый характер, тем или иным образом обязательно связано с рассматриваемым понятием.

Сферы применения

Данное явление широко применяется практически во всех точных науках, особенно носящих экспериментальный характер.

Поиск среднего имеет огромное значение в медицине, инженерных дисциплинах, кулинарии, экономике, политике и т. п.

Основываясь на данных, полученных от подобных обобщений, разрабатывают лечебные препараты, учебные программы, устанавливают минимальные прожиточные минимумы и зарплаты, строят учебные графики, производят мебель, одежду и обувь, предметы гигиены и многое другое.

В математике данный термин именуется «средним значением» и применяется для осуществления решений различных примеров и задач. Наиболее простыми из них являются сложение и вычитание с обычными дробями. Ведь, как известно, для решения подобных примеров необходимо привести обе дроби к общему знаменателю.

Также в царице точных наук часто применяется близкий по смыслу термин «значение среднее случайной величины». Большинству он более знаком как «математическое ожидание», чаще рассматриваемое в теории вероятности. Стоит отметить, что подобное явление также применяется и при произведении статистических вычислений.

Средняя величина в статистике

Однако чаще всего изучаемое понятие используется в статистике. Как известно, эта наука сама по себе специализируется на вычислении и анализе количественной характеристики массовых общественных явлений. Поэтому средняя величина в статистике используется в качестве специализированного метода достижения ее основных задач - сбора и анализа информации.

Суть данного статистического метода заключается в замене индивидуальных уникальных значений рассматриваемого признака определенной уравновешенной средней величиной.

В качестве примера можно привести знаменитую шутку о еде. Итак, на неком заводе по вторникам на обед его начальство обычно ест мясную запеканку, а простые рабочие - тушеную капусту. На основе этих данных можно сделать вывод, что в среднем коллектив завода по вторникам обедает голубцами.

Хотя данный пример слегка утрирован, однако он иллюстрирует главный недостаток метода поиска средней величины - нивелирование индивидуальных особенностей предметов или личностей.

В средних величин применяются не только для анализа собранной информации, но и для планирования и прогнозирования дальнейших действий.

Также с его помощью производится оценка достигнутых результатов (например, выполнение плана по выращиванию и сбору урожая пшеницы за весенне-летний сезон).

Как правильно рассчитать

Хотя в зависимости от вида СВ существуют разные формулы ее вычисления, в общей теории статистики, как правило, применяется всего один способ расчета средней величины признака. Для этого нужно сначала сложить вместе значения всех явлений, а затем разделить получившуюся сумму на их количество.

При произведении подобных вычислений стоит помнить, что средняя величина всегда имеет ту же размерность (или единицы измерения), что и отдельная единица совокупности.

Условия правильного вычисления

Рассмотренная выше формула весьма проста и универсальна, так что ошибиться в ней практически невозможно. Однако всегда стоит учитывать два аспекта, иначе полученные данные не будут отражать реальную ситуацию.


Классы СВ

Найдя ответы на основные вопросы: "Средняя величина - это что такое?", "Где применяется она?" и "Как можно вычислить ее?", стоит узнать, какие классы и виды СВ существуют.

Прежде всего это явление делится на 2 класса. Это структурные и степенные средние величины.

Виды степенных СВ

Каждый из вышеперечисленных классов, в свою очередь, делится на виды. У степенного класса их четыре.

  • Средняя арифметическая величина - это наиболее распространенный вид СВ. Она являет собою среднее слагаемое, при определении коего общий объем рассматриваемого признака в совокупности данных поровну распределяется между всеми единицами данной совокупности.

    Этот вид делится на подвиды: простая и взвешенная арифметическая СВ.

  • Средняя гармоническая величина - это показатель, обратный средней арифметической простой, вычисляемый из обратных значений рассматриваемого признака.

    Она применяется в тех случаях, когда известны индивидуальные значения признака и произведение, а данные частоты - нет.

  • Средняя геометрическая величина чаще всего применима при анализе темпов роста экономических явлений. Она дает возможность сохранять в неизменном виде произведение индивидуальных значений данной величины, а не сумму.

    Также бывает простой и взвешенной.

  • Средняя квадратическая величина используется при расчете отдельных показателе показателей, таких как коэффициент вариации, характеризующего ритмичность выпуска продукции и т. п.

    Также с ее помощью вычисляются средние диаметры труб, колес, средние стороны квадрата и подобных фигур.

    Как и все остальные виды средних СВ, среднеквадратическая бывает простой и взвешенной.

Виды структурных величин

Помимо средних СВ, в статистике довольно часто используются структурные виды. Они лучше подходят для расчета относительных характеристик величин варьирующего признака и внутреннего строения рядов распределения.

Таких видов существует два.


Наиболее распространенной формой статистических показателей, используемых в социально-экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака статистической совокупности. Средние величины являются как бы «представителями» всего ряда наблюдений. Определить среднюю можно во многих случаях через исходное соотношение средней (ИСС) или ее логическую формулу: . Так, например, для расчета средней заработной платы работников предприятия необходимо общий фонд заработной платы разделить на число работников: Числитель исходного соотношения средней представляет собой ее определяющий показатель. Для средней заработной платы таким определяющим показателем является фонд заработной платы. Для каждого показателя, используемого в социально-экономическом анализе, можно составить только одно истинное исходное соотношение для расчета средней. Следует еще добавить, что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выражения под корнем надо использовать не n , а n- 1.

Понятие и виды средних величин

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой. Существует 2 класса средних величин: степенные и структурные. К структурным средним относятсямода имедиана , но наиболее часто применяютсястепенные средние различных видов.

Степенные средние величины

Степенные средние могут быть простыми и взвешенными .

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле средней степенной (при различной величине k (m)):

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

Где x - средняя величина исследуемого явления; x i – i -й вариант усредняемого признака ;

f i – вес i -го варианта.

Где X – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин:
при m = -1 средняя гармоническая;
при m = 0 средняя геометрическая;
при m = 1 средняя арифметическая;
при m = 2 средняя квадратическая;
при m = 3 средняя кубическая.

Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.

Средняя арифметическая

Средняя арифметическая – начальный момент первого порядка, математическое ожидание значений случайной величины при большом числе испытаний;

Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

или

Где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4. Средняя арифметическая взвешенная имеет следующий вид:

Где f - количество величин с одинаковым значением X (частота). >Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4. Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X. Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет): (2*10+4*20+6*5)/(10+20+5) = 3,71 года.

Функция СРЗНАЧ

Эта функция вычисляет среднее (арифметическое) своих аргументов.

СРЗНАЧ(число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее.

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.

Функция СРЗНАЧА

Вычисляет среднее арифметическое значений, заданных в списке аргументов. Помимо чисел в расчете могут участвовать текст и логические значения, такие как ИСТИНА и ЛОЖЬ.

СРЗНАЧА(значение1,значение2,...)

Значение1, значение2,... - это от 1 до 30 ячеек, интервалов ячеек или значений, для которых вычисляется среднее.

Аргументы должны быть числами, именами, массивами или ссылками. Массивы и ссылки, содержащие текст, интерпретируются как 0 (ноль). Пустой текст ("") интерпретируется как 0 (ноль). Аргументы, содержащие значение ИСТИНА, интерпретируются как 1, Аргументы, содержащие значение ЛОЖЬ, интерпретируются как 0 (ноль).

Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.

Средняя гармоническая

Средняя гармоническая для определения средней суммы обратных величин;

Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой: или Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно - со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w 1 =w 2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.

Функция СРГАРМ

Возвращает среднее гармоническое множества данных. Среднее гармоническое - это величина, обратная к среднему арифметическому обратных величин.

СРГАРМ(число1;число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Среднее гармоническое всегда меньше среднего геометрического, которое всегда меньше среднего арифметического.

Средняя геометрическая

Средняя геометрическая для оценки средних темпов роста случайной величин, нахождения значения признака, равноудаленного от минимального и максимального значения;

Средняя геометрическая применяется при определении средних относительных изменений. Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X. Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году - 1,109; в 2006 - 1,090; в 2007 - 1,119; в 2008 - 1,133. Так как индекс инфляции - это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.

Функция СРГЕОМ

Возвращает среднее геометрическое значений массива или интервала положительных чисел. Например, функцию СРГЕОМ можно использовать для вычисления средних темпов роста, если задан составной доход с переменными ставками.

СРГЕОМ (число1; число2; ...)

Число1, число2, ... - это от 1 до 30 аргументов, для которых вычисляется среднее геометрическое. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.

Средняя квадратическая

Средняя квадратическая – начальный момент второго порядка.

Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений. Главной сферой применения квадратической средней является измерение вариации значений X.

Средняя кубическая

Средняя кубическая – начальный момент третьего порядка.

Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.