Теоретичні функції розподілу
В ході роботи з вибірковою сукупністю іноді виникає необхідність описати вариационную криву за допомогою математичної функції. Для характеристики варіаційної кривої можна підібрати ряд математичних залежностей. Вибирають ту, яка найбільш реально відображає сутність об`єкта дослідження. Вибір математичної залежності, яка описує розподіл, проводиться шляхом підбору підходящої математичної моделі, яка визначає вид функції розподілу. Потім знаходять параметри функції і перевіряють її відповідність емпіричного розподілу.
У географії більшість закономірно повторюваних явищ, процесів можна представити у вигляді нормального і логнормального розподілу. Рідше зустрічається біноміальний розподіл, розподіл Пуассона та інші.
Біноміальний розподіл (розподіл Бернуллі) виникає, коли оцінюється скільки разів відбувається подія в серії певного числа незалежних, які виконуються в однакових умовах спостережень. Розкид варіант - наслідок впливу ряду незалежних і випадково поєднаних факторів (є подія або його немає). Характерно для альтернативного типу мінливості ознаки.
Розподіл Пуассона розглядається як граничний випадок біноміального розподілу і використовується для характеристики рідкісних подій. Відмітна особливість розподілу Пуассона - величина дисперсії близька до величини середнього арифметичного, наприклад, тривале повінь. Це проявляється в ситуаціях, коли в певний відрізок часу або на певному просторі відбувається випадкове число будь-яких подій, наприклад, тривалий час повторюються урагани протягом одного літнього періоду. На графіку це розподіл представляється у вигляді різко вираженою асиметрії.
Розглянемо більш детально найбільш характерні типи теоретичних розподілів в природі та суспільстві: нормальне і логнормальний розподіл.
Нормальний розподіл. Нормальне (розподіл Гаусса) використовується для наближеного опису явищ, які носять імовірнісний, випадковий характер. Пріоритет у відкритті цього закону належить Де Муавру (1733), але його пов`язують з ім`ям Гаусса, що досліджував його на початку 19 ст.
Розподіл Гаусса має місце серед природних і економічних явищ. В системі ознака варіює під впливом великої кількості взаємно незалежних факторів, кожен з яких мало впливає на його загальну варіабельність. Причому одні фактори призводять до зростання величини ознаки, інші - до зменшення. Зустрічальність варіантів, які займають середину сукупності, максимальна. Такий розподіл вважається нормою для випадкових величин, тому воно отримало назву нормального. Графічно нормальний розподіл виражається плавної симетричною куполоподібної кривої з наближенням до осі абсцис гілками (крива щільності нормального розподілу).
Крива показує, що великі відхилення від середньої зустрічаються рідше, ніж малі. Зі зменшенням середнього квадратичного відхилення (sigma-) крива нормального розподілу стає все більш гостровершинності. Площа, яка знаходиться під кривою нормального, завжди приймається рівною одиниці.При нормальному розподілі середнє, мода і медіана збігаються. Крива щільності не перетинає осі абсцис, що підтверджує ймовірність існування необмежено великих відхилень. Рівняння нормального розподілу можна записати в декількох модифікаціях.
Підставивши необхідні значення з досліджуваної статистичної сукупності в формулу, розрахуємо теоретичні частоти нормального розподілу f # 61449-для кожного класу сукупності. Отримаємо ряди теоретичних (f# 61449-) І емпіричних (f) Даних:
f | 8 | 17 | 34 | 70 | 141 | 165 | 253 | 187 | 145 | 85 | 51 | 25 | 19 |
f# 61449; | 7 | 16 | 39 | 79 | 131 | 180 | 206 | 196 | 154 | 101 | 55 | 24 | 13 |
Були прийняті наступні вихідні дані для розрахунку: N= 1200, М = 10,22, sigma- = 2,31, i= 13.
Зробимо перевірку відповідності емпіричних частот обчисленим частотам нормального розподілу. Для цього, використовуючи критерій хі-квадрат, складаємо таблицю за формою:
f | f # 61449; | f - f # 61449; | (F - f # 61449-)2 | (F - f# 61449-)2 / f # 61449; |
Сума показників в останньому стовпчику буде складати величину chi-2, рівну 21,184. Отримана величина порівнюється зі стандартною величиною chi-2 при числі свободи: nu- = i- 3 = 13 - 3 = 10 (см. Вище ряди по частотах).
табличні значення chi-2 наступні: для Р = 0,95 і 0,99 chi-2 = 18,307 і 23,209 відповідно. розраховане значення chi-2 = 21,184 знаходиться між зазначеними табличними значеннями. Оскільки розрахункове значення chi-2 не перевищує табличну величину при Р = 0,99, можна вважати, що емпіричне розподіл ознаки задовільно підкоряється нормальному закону розподілу.
При нормальному розподілі близько 68,3% всіх варіант відхиляється від середнього значення не більше, ніж на величину середнього квадратичного відхилення (± sigma-). Відповідно в межах від -2sigma- до + 2sigma- знаходиться 95,5% варіант, в межах від -3sigma- до + 3sigma- - 99,7%.
Відхилення варіант від нормального закону розподілу вказує на вплив будь-якого іншого фактора на статистичну сукупність.
Логнормальний розподіл. Деякі розподілу при вивченні географічних об`єктів мають виражену асиметрію, тому становить практичний інтерес перетворення асиметричного розподілу в симетричне (нормальне). Іноді це можливо, якщо кожну варіанту вибірки висловити у вигляді логарифма (lgxi). У тих випадках, коли логарифм випадкової величини (xi) Підпорядковується нормальному розподілу, а самі значення випадкових величин розподілені асиметрично, розподіл випадкової величини прийнято називати логарифмически нормальним, або логнормальний. Наприклад, до логнормальному розподілу можна віднести розподіл мікроелементів у ґрунтах, породах.