Бэйсийн томъёогоор тодорхойлно. Нийт магадлалын томъёо, Бэйсийн томъёо

Хичээл №4.

Сэдэв: Нийт магадлалын томъёо. Бэйсийн томъёо. Бернулли схем. Полином хэлхээ. Гипергеометрийн схем.

НИЙТ МАГАДЛЫН ТОМЪЁО

Бэйсийн Формула

ОНОЛ

Нийт магадлалын томъёо:

Тохиромжгүй үйл явдлуудын бүрэн бүлэг байх болтугай:

(, ).Тэгвэл А үйл явдлын магадлалыг томъёогоор тооцоолж болно

(4.1)

Үйл явдлыг таамаглал гэж нэрлэдэг. Туршилтын тодорхой бус байдал байгаа хэсгийн талаар таамаглал дэвшүүлдэг.

, таамаглалуудын өмнөх магадлал хаана байна

Бэйсийн томъёо:

Туршилтыг дуусгаж, туршилтын үр дүнд А үйл явдал болсон нь мэдэгдэж байна. Дараа нь энэ мэдээллийг харгалзан үзэх боломжтой таамаглалын магадлалыг хэтрүүлэн үнэлэх:

(4.2)

, Хаана таамаглалын арын магадлал

АСУУДАЛ ШИЙДЭХ

Даалгавар 1.

Нөхцөл байдал

Агуулахад ирсэн 3 багц эд ангид ашиглах боломжтой хэсгүүд нь: 89 %, 92 % Тэгээд 97 % үүний дагуу. Багц дахь хэсгүүдийн тоог хэлнэ 1:2:3.

Агуулахаас санамсаргүй байдлаар сонгосон хэсэг нь гэмтэлтэй байх магадлал хэд вэ? Санамсаргүй байдлаар сонгосон хэсэг нь гэмтэлтэй болсныг мэдэгдье. Нэг, хоёр, гуравдагч этгээдэд хамаарах магадлалыг ол.

Шийдэл:

Санамсаргүй байдлаар сонгосон хэсэг нь гэмтэлтэй болох үйл явдлыг А-аар тэмдэглэе.

1-р асуулт - нийт магадлалын томъёонд

2-р асуулт - Бэйсийн томъёогоор

Туршилтын тодорхой бус байдал байгаа хэсгийн талаар таамаглал дэвшүүлдэг. Энэ асуудалд санамсаргүй байдлаар сонгосон хэсэг нь аль багцаас байгаа нь тодорхойгүй байна.

Эхний тоглолтонд орцгооё Адэлгэрэнгүй. Дараа нь хоёр дахь тоглолтонд - 2 адэлгэрэнгүй, гуравдугаарт - 3 адэлгэрэнгүй. Гурван багцаар 6 адэлгэрэнгүй.

(эхний мөрөнд гарсан согогийн хувийг магадлалд хөрвүүлсэн)


(хоёр дахь мөрөнд гарсан согогийн хувийг магадлалд шилжүүлсэн)

(гурав дахь мөрөнд гарсан согогийн хувийг магадлалд шилжүүлсэн)

Нийт магадлалын томъёог ашиглан бид үйл явдлын магадлалыг тооцоолно А

-1 асуултын хариулт

Гэмтэлтэй хэсэг нь эхний, хоёр, гурав дахь багцад хамаарах магадлалыг Байесийн томъёогоор тооцоолно.

Даалгавар 2.

Нөхцөл:

Эхний саванд 10 бөмбөг: 4 цагаан ба 6 хар. Хоёр дахь саванд 20 бөмбөг: 2 цагаан ба 18 хар. Нэг бөмбөгийг сав бүрээс санамсаргүй байдлаар сонгож, гурав дахь саванд хийнэ. Дараа нь гурав дахь савнаас нэг бөмбөгийг санамсаргүй байдлаар сонгоно. Гурав дахь савнаас гаргасан бөмбөг цагаан өнгөтэй байх магадлалыг ол.

Шийдэл:

Асуудлын асуултын хариултыг нийт магадлалын томъёог ашиглан авч болно.

Гурав дахь саванд аль бөмбөг орох нь тодорхойгүй байна. Гурав дахь саванд байгаа бөмбөлгүүдийн найрлагын талаархи таамаглалыг бид дэвшүүлэв.

H1=(гурав дахь саванд 2 цагаан бөмбөлөг байна)

H2=(гурав дахь саванд 2 хар бөмбөг байна)

H3=(гурав дахь саванд 1 цагаан, 1 хар бөмбөг байна)

A=(3-р савнаас авсан бөмбөг цагаан өнгөтэй болно)

Даалгавар 3.

Цагаан бөмбөгийг үл мэдэгдэх өнгөтэй 2 бөмбөг агуулсан саванд хийнэ. Үүний дараа бид энэ савнаас 1 бөмбөг авдаг. Урднаас гаргаж авсан бөмбөг цагаан өнгөтэй байх магадлалыг ол. Дээр дурдсан савнаас авсан бөмбөг цагаан өнгөтэй болжээ. Үүний магадлалыг ол Хөдлөхөөс өмнө саванд 0 цагаан бөмбөг, 1 цагаан бөмбөг, 2 цагаан бөмбөг байсан .

1 асуултв - нийт магадлалын томьёо руу

Асуулт 2-Бэйсийн томъёогоор

Тодорхой бус байдал нь саванд байгаа бөмбөлгүүдийн анхны найрлагад оршдог. Урнаа дахь бөмбөгний анхны найрлагын талаар бид дараахь таамаглал дэвшүүлэв.

Сайн уу=(нүүхээсээ өмнө хогийн саванд байсанi-1 цагаан бөмбөг),i=1,2,3

, i=1,2,3(бүрэн тодорхойгүй нөхцөл байдалд бид таамаглалын априори магадлалыг ижил гэж үздэг, учир нь бид нэг хувилбар нөгөөгөөсөө илүү магадлалтай гэж хэлж чадахгүй)

A=(байршлыг нь өөрчилсний дараа савнаас гаргаж авсан бөмбөг цагаан өнгөтэй болно)

Нөхцөлт магадлалыг тооцоолъё:

Нийт магадлалын томъёог ашиглан тооцоо хийцгээе.

1 асуултанд хариулна уу

Хоёр дахь асуултанд хариулахын тулд бид Bayes-ийн томъёог ашиглана:

(өмнөх магадлалтай харьцуулахад буурсан)

(өмнөх магадлалтай харьцуулахад өөрчлөгдөөгүй)

(өмнөх магадлалтай харьцуулахад нэмэгдсэн)

Таамаглалын априор болон хойд магадлалыг харьцуулсан дүгнэлт: анхны тодорхойгүй байдал тоон хувьд өөрчлөгдсөн.

Даалгавар 4.

Нөхцөл:

Цус сэлбэхдээ донор болон өвчтөний цусны бүлгийг харгалзан үзэх шаардлагатай. Байгаа хүн дөрөв дэх бүлэгцус Та ямар ч төрлийн цус сэлбэж болно, хүн хоёр ба гуравдугаар бүлэгтэйцутгаж болно эсвэл түүний төрлийн цус, эсвэл эхлээд.Хүн рүү эхний цусны бүлэгтэйцус сэлбэж чадах уу? зөвхөн эхний бүлэг.Энэ нь хүн амын дунд мэдэгдэж байна 33,7 % байна эхний бүлэгпу, 37,5 % байна хоёрдугаар бүлэг, 20.9%байна гурав дахь бүлэгТэгээд 7.9% нь 4-р бүлэгтэй.Санамсаргүй өвчтөнд санамсаргүй донороос цус сэлбэх магадлалыг ол.


Шийдэл:

Бид санамсаргүй байдлаар сонгосон өвчтөний цусны бүлгийн талаархи таамаглал дэвшүүлэв.

Сайн уу=(өвчтөндi-р цусны бүлэг),i=1,2,3,4

(Магадлал руу хөрвүүлсэн хувь)

A=(цус сэлбэх боломжтой)

Нийт магадлалын томъёог ашиглан бид дараахь зүйлийг авна.

Өөрөөр хэлбэл, ойролцоогоор 60% -д цус сэлбэх боломжтой

Бернулли схем (эсвэл бином схем)

Бернуллигийн туршилтууд -Энэ бие даасан туршилтууд 2 үр дүн, үүнийг бид уламжлалт байдлаар нэрлэдэг амжилт, бүтэлгүйтэл.

p-амжилтанд хүрэх магадлал

q- бүтэлгүйтлийн магадлал

Амжилтанд хүрэх магадлал туршлагаас туршлагад өөрчлөгддөггүй

Өмнөх туршилтын үр дүн нь дараах сорилтод нөлөөлөхгүй.

Дээр дурдсан туршилтуудыг явуулахыг Бернулли схем эсвэл бином схем гэж нэрлэдэг.

Бернулли тестийн жишээ:

Зоос шидэх

Амжилт -сүлд

Амжилтгүй -сүүл

Шударга зоосны хэрэг

буруу зоосны тохиолдол

хТэгээд qтуршилтын явцад зоосыг өөрчлөхгүй бол туршилтаас туршилт руу бүү өөрчлөөрэй

Шоо шидэх

Амжилт -өнхрөх "6"

Бүтэлгүйтэл -бусад бүх зүйл

Шударга үхлийн хэрэг

Тогтмол бус үхлийн тохиолдол

хТэгээд qтуршилтын явцад бид шоо өөрчлөхгүй бол туршилтаас туршилт руу бүү өөрчлөөрэй

Буудагч бай руу буудаж байна

Амжилт -цохих

Бүтэлгүйтэл -мисс

p =0.1 (буудагч 10-аас нэг удаа цохисон)

хТэгээд qхэрэв бид туршилтын явцад мэргэн буучийг өөрчлөхгүй бол туршилтаас туршилт руу бүү өөрчлөөрэй

Бернуллигийн томъёо.

Болъёявуулсан n х. Үйл явдлыг авч үзье

Амжилттай байх магадлалтай Бернулли тестүүдp тохиолдох болноm амжилт),

-Ийм үйл явдлын магадлалын хувьд стандарт тэмдэглэгээ байдаг

<-Магадлалыг тооцоолох Бернулли томъёо (4.3)

Томъёоны тайлбар : m амжилтанд хүрэх магадлал (туршилтууд нь бие даасан, бүгд ижил байдаг тул магадлалыг үржүүлдэг), - n-m алдаа гарах магадлал (тайлбар нь амжилтынхтай төстэй) , - үйл явдлыг хэрэгжүүлэх арга замын тоо, өөрөөр хэлбэл m амжилтыг n газарт хэдэн аргаар байрлуулах боломжтой.

Бернуллигийн томъёоны үр дүн:

Үр дүн 1:

Болъёявуулсан nБернулли амжилттай байх магадлалтай тестүүд х. Үйл явдлыг авч үзье

А(м1,m2)=(амжилтын тооn Бернулли тестүүд [хүрээнд байх болно.м1;м2])

(4.4)

Томъёоны тайлбар: Томъёо (4.4) нь (4.3) томьёо болон үл нийцэх үйл явдлын магадлалыг нэмэх теоремоос гарна. нь үл нийцэх үйл явдлын нийлбэр (нэгдэл) бөгөөд тус бүрийн магадлалыг (4.3) томъёогоор тодорхойлно.

Дүгнэлт 2

Болъёявуулсан nБернулли амжилттай байх магадлалтай тестүүд х. Үйл явдлыг авч үзье

A=( инБернуллигийн туршилтууд дор хаяж 1 амжилтанд хүрнэ}

(4.5)

Томъёоны тайлбар: ={ Бернуллигийн туршилтанд амжилтанд хүрэхгүй) =

(бүх n туршилт амжилтгүй болно)

Бодлого (Бернуллигийн томъёо ба түүний үр дагавар) 1.6-D асуудлын жишээ. h.

Зөв зоос 10 удаа шидэв. Дараах үйл явдлын магадлалыг ол.

A=(Сүлд яг 5 удаа гарч ирнэ)

B=(сүлд 5-аас илүүгүй удаа гарч ирнэ)

C=(сүлд дор хаяж 1 удаа гарч ирнэ)

Шийдэл:

Асуудлыг Бернулли тестээр дахин томъёолъё.

n=10 туршилтын тоо

амжилт- сүлд

p=0.5 – амжилтанд хүрэх магадлал

q=1-p=0.5 – бүтэлгүйтлийн магадлал

А үйл явдлын магадлалыг тооцоолохын тулд бид ашигладаг Бернулли томъёо:

В үйл явдлын магадлалыг тооцоолохын тулд бид ашигладаг үр дагавар 1руу Бернулли томъёо:

С үйл явдлын магадлалыг тооцоолохын тулд бид ашигладаг үр дагавар 2руу Бернулли томъёо:

Бернулли схем. Ойролцоогоор томъёо ашиглан тооцоо хийх.

ОЙРОГЧИЛСАН MOIVRE-LAPLACE FORMULA

Орон нутгийн томъёо

хамжилт ба qбүтэлгүйтэл нь хүн бүрт байдаг мОйролцоо томъёо хүчинтэй байна:

, (4.6)

м.

Функцийн утгыг тусгай хэсгээс олж болно ширээ. Энэ нь зөвхөн утгыг агуулдаг. Гэхдээ функц нь тэгш, өөрөөр хэлбэл.

Хэрэв тийм бол тэд итгэдэг

Интеграл томъёо

Хэрэв Бернулли схемд туршилтын тоо n их, магадлал нь бас их байвал хамжилт ба qбүтэлгүйтэл, дараа нь ойролцоогоор томъёо нь хүн бүрт хүчинтэй байна (4.7) :

Функцийн утгыг тусгай хүснэгтээс олж болно. Энэ нь зөвхөн утгыг агуулдаг. Гэхдээ функц нь хачирхалтай, өөрөөр хэлбэл. .

Хэрэв тийм бол тэд итгэдэг

ХОРЫН ОЙРОЛЦООНЫ ТОМЪЁОУУД

Орон нутгийн томъёо

Туршилтын тоог үзье nБернуллигийн схемийн дагуу нэг туршилтанд амжилтанд хүрэх магадлал бага бөгөөд бүтээгдэхүүн . Дараа нь ойролцоогоор томъёогоор тодорхойлно:

, (4.8)

N Bernoulli туршилтын амжилтын тоо нь магадлал м.

Функцийн утгууд тусгай хүснэгтээс олж болно.

Интеграл томъёо

Туршилтын тоог үзье nБернуллигийн схемийн дагуу нэг туршилтанд амжилтанд хүрэх магадлал бага бөгөөд бүтээгдэхүүн .

Дараа нь ойролцоогоор томъёогоор тодорхойлно:

, (4.9)

Бернуллигийн туршилтын амжилтын тоо хязгаарт байна гэсэн магадлал .

Функцийн утгууд тусгай хүснэгтээр харж, дараа нь мужид нэгтгэн дүгнэж болно.

Томъёо

Пуассоны томъёо

Мойвр-Лаплас томъёо

Чанартай

үнэлгээ

тооцоо бүдүүлэг байна

10

бүдүүлэг тооцоололд ашигладаг

тооцоолол

хэрэглээнд ашигладаг

инженерийн тооцоо

100 0

аливаа инженерийн тооцоонд ашигладаг

n>1000

үнэлгээний маш сайн чанар

Та 1.7 ба 1.8 асуудлын жишээг харж болно D. z.

Пуассоны томъёог ашиглан тооцоолно.

Асуудал (Пуассоны томъёо).

Нөхцөл:

Харилцаа холбооны шугамаар мессеж дамжуулах үед нэг тэмдэгтийн гажуудал үүсэх магадлал тэнцүү байна 0.001. Хэрэв ямар нэгэн гажуудал байхгүй бол мессежийг хүлээн зөвшөөрсөн гэж үзнэ. Зурвасаас бүрдэх магадлалыг ол 20 үгс тус бүр 100тэмдэгт тус бүр.

Шийдэл:

-ээр тэмдэглэе А

-мессеж дэх тэмдэгтүүдийн тоо

амжилт: тэмдэг нь гажуудаагүй

Амжилтанд хүрэх магадлал

Тооцоод үзье. Ойролцоо томъёог ашиглах зөвлөмжийг үзнэ үү ( ) : тооцооны хувьд та өргөдөл гаргах шаардлагатай Пуассоны томъёо

Пуассоны томьёоны магадлалыг болонm-ийг тусгай хүснэгтээс олж болно.

Нөхцөл:

Утасны станц нь 1000 хэрэглэгчдэд үйлчилдэг. Захиалагч нэг минутын дотор холболт хийх шаардлагатай байх магадлал 0.0007 байна. Утасны станцад минут тутамд 3-аас доошгүй дуудлага ирэх магадлалыг тооцоол.

Шийдэл:

Асуудлыг Бернулли схемийн дагуу дахин томъёолъё

амжилт: дуудлага хүлээн авсан

Амжилтанд хүрэх магадлал

– амжилтын тоо байх ёстой хүрээ

A = (дор хаяж гурван дуудлага ирэх болно) - магадлал шаардлагатай үйл явдал. Асуудлыг олох

(гурваас бага дуудлага хүлээн авсан) Нэмэлт рүү оч. үйл явдал, учир нь түүний магадлалыг тооцоолоход хялбар байдаг.

(нөхцөлийн тооцоо, тусгай хүснэгтийг үзнэ үү)

Тиймээс,

Асуудал (орон нутгийн Мувр-Лаплас томъёо)

Нөхцөл байдал

Байгаа нэг сумаар онох магадлал 0.8-тай тэнцүү.магадлалыг тодорхойл 400-дбуудлага болно яг 300хит.

Шийдэл:

Асуудлыг Бернулли схемийн дагуу дахин томъёолъё

n=400 – туршилтын тоо

m=300 - амжилтын тоо

амжилт - цохилт

(Бернулли схемийн хувьд асуудалтай асуулт)

Урьдчилсан тооцоо:

Бид гүйцэтгэдэг бие даасан туршилтууд, бид тус бүрийг нь ялгаж үздэг m сонголтууд.

p1 - ​​нэг туршилтаар эхний сонголтыг авах магадлал

p2 - нэг туршилтаар хоёр дахь сонголтыг авах магадлал

…………..

pm - хүлээн авах магадлалНэг туршилтын m-th сонголт

p1,p2, ……………..,pm туршлагаас туршлага болгон өөрчлөхгүй

Дээр дурдсан туршилтын дарааллыг дуудна олон гишүүнт схем.

(m=2 бол олон гишүүнт схем нь хоёр гишүүний схем болж хувирдаг), өөрөөр хэлбэл дээрх хоёр гишүүнт схем нь олон гишүүнт гэж нэрлэгддэг илүү ерөнхий схемийн онцгой тохиолдол юм).

Дараах үйл явдлуудыг авч үзье

A(n1,n2,….,nm)=(дээр тайлбарласан n туршилтанд 1-р сонголт n1 удаа, 2-р сонголт n2 удаа, ….. гэх мэт, m сонголт nm удаа гарч ирсэн)

Олон гишүүнт схемийг ашиглан магадлалыг тооцоолох томъёо

Нөхцөл байдал

Шоо 10 удаа шидсэн.Та "6" өнхрөх магадлалыг олох хэрэгтэй 2 удаа, мөн "5" гарч ирнэ 3 удаа.

Шийдэл:

-ээр тэмдэглэе А асуудалд магадлалыг олох шаардлагатай үйл явдал.

n=10 –туршилтын тоо

м=3

1-р сонголт - өнхрөх 6

p1=1/6n1=2

2-р сонголт - өнхрөх 5

p2=1/6n2=3

Сонголт 3 - 5 ба 6-аас бусад ирмэгээс унах

p3=4/6n3=5

P(2,3,5)-? (асуудлын мэдэгдэлд дурдсан үйл явдлын магадлал)

Полином хэлхээний асуудал

Нөхцөл байдал

Үүний магадлалыг ол 10 санамсаргүй байдлаар сонгогдсон хүмүүсийн дөрөв нь нэгдүгээр улиралд, гурав нь хоёрдугаар улиралд, хоёр нь гуравт, нэг нь дөрөвдүгээр улиралд төрсөн өдрөө тэмдэглэнэ.

Шийдэл:

-ээр тэмдэглэе А асуудалд магадлалыг олох шаардлагатай үйл явдал.

Асуудлыг олон гишүүнт схемээр дахин томъёолъё.

n=10 –туршилтын тоо = хүмүүсийн тоо

м=4– туршилт бүрт бидний ялгадаг сонголтуудын тоо

Сонголт 1 - 1-р улиралд төрөлт

p1=1/4n1=4

Сонголт 2 - 2-р улиралд төрөлт

p2=1/4n2=3

Сонголт 3 - 3-р улиралд төрөлт

p3=1/4n3=2

Сонголт 4 - 4-р улиралд төрөлт

p4=1/4n4=1

P(4,3,2,1)-? (асуудлын мэдэгдэлд дурдсан үйл явдлын магадлал)

Бид аль ч улиралд төрөх магадлал ижил бөгөөд 1/4-тэй тэнцүү гэж үздэг.Олон гишүүнт схемийн томъёог ашиглан тооцооллыг хийцгээе.

Полином хэлхээний асуудал

Нөхцөл байдал

Уурхайн саванд 30 бөмбөг: дахин тавтай морил.3 цагаан, 2 ногоон, 4 хөх, 1 шар.

Шийдэл:

-ээр тэмдэглэе А асуудалд магадлалыг олох шаардлагатай үйл явдал.

Асуудлыг олон гишүүнт схемээр дахин томъёолъё.

n=10 –туршилтын тоо = сонгосон бөмбөгний тоо

м=4– туршилт бүрт бидний ялгадаг сонголтуудын тоо

Сонголт 1 - цагаан бөмбөг сонгох

p1=1/3n1=3

Сонголт 2 - ногоон бөмбөг сонгох

p2=1/6n2=2

Сонголт 3 - цэнхэр бөмбөг сонгох

p3=4/15n3=4

Сонголт 4 - шар бөмбөг сонгох

p4=7/30n4=1

P(3,2,4,1)-? (асуудлын мэдэгдэлд дурдсан үйл явдлын магадлал)

p1,p2, p3,p4 Сонголтыг буцаах замаар хийдэг тул туршлагаас туршлага руу бүү өөрчил

Олон гишүүнт схемийн томъёог ашиглан тооцооллыг хийцгээе.

Гипергеометрийн схем

k төрлийн n элемент байг:

Эхний төрлийн n1

Хоёр дахь төрлийн n2

nk k-р төрөл

Эдгээр n элементээс санамсаргүй байдлаар буцаж ирэхгүй m элемент сонгох

Сонгогдсон m элементийн дотор байхаас бүрдэх A(m1,…,mk) үйл явдлыг авч үзье.

m1 эхний төрөл

хоёр дахь төрлийн м2

mk k-р төрөл

Энэ үйл явдлын магадлалыг томъёогоор тооцоолно

P(A(m1,…,mk))= (4.11)

Жишээ 1.

Гипергеометрийн схем дээрх бодлого (1.9-р асуудлын жишээ D. h)

Нөхцөл байдал

Уурхайн саванд 30 бөмбөг: 10 цагаан, 5 ногоон, 8 цэнхэр, 7 шар(бөмбөг нь зөвхөн өнгөөрөө ялгаатай). 10 бөмбөгийг савнаас санамсаргүй байдлаар сонгоно буцаж ирэхгүй. Сонгосон бөмбөлгүүдийн дунд дараахь байх магадлалыг ол. 3 цагаан, 2 ногоон, 4 хөх, 1 шар.

Бидэнд байнаn=30,k=4,

n1=10,n2=5,n3=8,n4=7,

m1=3,м2=2,м3=4,m4=1

P(A(3,2,4,1))= = та хослолын томъёог мэдэж байгаа тоо хүртэл тоолж болно

Жишээ 2.

Энэ схемийг ашиглан тооцоо хийх жишээ: Sportloto тоглоомын тооцоог үзнэ үү (сэдэв 1)

Бэйс гэж хэн бэ? энэ нь менежменттэй ямар холбоотой вэ? - бүрэн шударга асуулт гарч ирж магадгүй юм. Одоохондоо миний үгийг хүлээж аваарай: энэ бол маш чухал!.. бас сонирхолтой (наад зах нь надад).

Ихэнх менежерүүд ямар парадигмыг баримталдаг вэ: Хэрэв би ямар нэг зүйлийг ажиглавал түүнээс ямар дүгнэлт хийж чадах вэ? Бэйс юу заадаг вэ: энэ зүйлийг ажиглахад надад юу байх ёстой вэ? Бүх шинжлэх ухаан яг ийм байдлаар хөгждөг бөгөөд энэ тухай тэрээр бичдэг (би санамжаас иш татав): толгойдоо онолгүй хүн янз бүрийн үйл явдлын (ажиглалтын) нөлөөн дор нэг санаанаас нөгөө санаа руу зугтдаг. Сайн онолоос илүү практик зүйл байхгүй гэж тэд хэлээгүй.

Практикаас жишээ. Миний доод албан тушаалтан алдаа гаргасан бөгөөд миний хамтрагч (өөр хэлтсийн дарга) хайхрамжгүй ажилтанд удирдлагын нөлөө үзүүлэх (өөрөөр хэлбэл шийтгэх / загнах) шаардлагатай гэж хэлдэг. Мөн энэ ажилтан сард 4-5 мянган ижил төрлийн үйл ажиллагаа явуулдаг бөгөөд энэ хугацаанд 10-аас илүүгүй алдаа гаргадаг гэдгийг би мэднэ. Та парадигмын ялгааг мэдэрч байна уу? Хамтран ажиллагсад маань ажиглалтанд хариу үйлдэл үзүүлж, ажилтан тодорхой тооны алдаа гаргадаг гэдгийг би урьдчилж мэддэг тул дахиад нэг нь энэ мэдлэгт нөлөөлсөнгүй ... Одоо, хэрэв сарын сүүлээр ийм алдаа гарсан бол тухайлбал, 15 ийм алдаа!.. Энэ нь аль хэдийн стандартын шаардлага хангаагүй шалтгааныг судлах үндэслэл болно.

Байесийн аргын ач холбогдлын талаар та итгэлтэй байна уу? Сонирхсон уу? Тийм гэж найдаж байна. Тэгээд одоо тосонд ялаа. Харамсалтай нь Байесийн санааг шууд өгөх нь ховор. Нийтлэг уран зохиолоор дамжуулан эдгээр санаануудтай танилцаж, уншсаны дараа олон асуулт үлдсэн тул би үнэхээр азгүй байсан. Тэмдэглэл бичихээр төлөвлөж байхдаа би өмнө нь Bayes дээр тэмдэглэсэн бүх зүйлээ цуглуулж, мөн Интернет дээр бичсэн зүйлийг судалж үзсэн. Би та бүхний анхааралд энэ сэдвээр хамгийн сайн таамаглалыг танилцуулж байна. Байесийн магадлалын танилцуулга.

Бэйсийн теоремын гарал үүсэл

Дараах туршилтыг авч үзье: бид сегмент дээр хэвтэж буй дурын тоог дуудаж, энэ тоо, жишээлбэл, 0.1-ээс 0.4-ийн хооронд байвал тэмдэглэнэ (Зураг 1a). Энэ үйл явдлын магадлал нь сегмент дээр тоо гарч ирэх тохиолдолд сегментийн уртыг сегментийн нийт урттай харьцуулсан харьцаатай тэнцүү байна. адил магадлалтай. Математикийн хувьд үүнийг бичиж болно х(0,1 <= x <= 0,4) = 0,3, или кратко r(X) = 0.3, хаана r- магадлал, X- муж дахь санамсаргүй хэмжигдэхүүн, X– муж дахь санамсаргүй хэмжигдэхүүн. Энэ нь сегментийг цохих магадлал 30% байна.

Цагаан будаа. 1. Магадлалын график тайлбар

Одоо x квадратыг авч үзье (Зураг 1b). Бид хос тоог нэрлэх ёстой гэж бодъё ( x, y), тус бүр нь тэгээс их, нэгээс бага байна. Тийм магадлал x(эхний тоо) нь сегментийн дотор байх болно (цэнхэр талбай 1), цэнхэр талбайн талбайг бүхэл бүтэн талбайн талбайн харьцаатай тэнцүү, өөрөөр хэлбэл (0.4 - 0.1) * (1 - 0) ) / (1 * 1) = 0, 3, өөрөөр хэлбэл ижил 30%. Тийм магадлал yсегмент дотор байрлах (ногоон талбай 2) нь ногоон талбайн талбайг бүхэл бүтэн талбайн талбайн харьцаатай тэнцүү байна. х(0,5 <= y <= 0,7) = 0,2, или кратко r(Ю) = 0,2.

Та үнэт зүйлсийн талаар нэгэн зэрэг юу сурч чадах вэ? xТэгээд y. Жишээлбэл, нэгэн зэрэг гарах магадлал хэд вэ xТэгээд yхаргалзах өгөгдсөн сегментүүдэд байна уу? Үүнийг хийхийн тулд та 3-р талбайн талбайн (ногоон ба цэнхэр судалтай огтлолцол) талбайн нийт талбайн харьцааг тооцоолох хэрэгтэй. х(X, Ю) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Одоо бид ямар магадлал байгааг мэдэхийг хүсч байна гэж бодъё yинтервалд байна if xхүрээнд аль хэдийн орсон байна. Энэ нь үнэн хэрэгтээ бидэнд шүүлтүүр байдаг бөгөөд бид хосуудыг дуудах үед ( x, y), дараа нь бид олох нөхцлийг хангахгүй байгаа хосуудыг нэн даруй хаядаг xөгөгдсөн интервалд, дараа нь шүүсэн хосуудаас бид үүнийг тооцдог yбидний нөхцөлийг хангаж, магадлалыг хосуудын тооны харьцаа гэж үздэг yДээрх сегментэд шүүсэн хосуудын нийт тоонд оршдог (өөрөөр хэлбэл xсегментэд оршдог). Бид энэ магадлалыг гэж бичиж болно х(Ю|X цагт Xхүрээг цохих." Мэдээжийн хэрэг, энэ магадлал нь 3-р талбайн цэнхэр 1-ийн талбайн харьцаатай тэнцүү байна. 3-р талбайн талбай нь (0.4 - 0.1) * (0.7 - 0.5) = 0.06, мөн цэнхэр талбайн талбай 1 ( 0.4 - 0.1) * (1 - 0) = 0.3, дараа нь тэдгээрийн харьцаа 0.06 / 0.3 = 0.2 байна. Өөрөөр хэлбэл, олох магадлал yгэж заасан сегмент дээр xсегментэд хамаарна х(Ю|X) = 0,2.

Өмнөх догол мөрөнд бид жинхэнэ утгыг томъёолсон: х(Ю|X) = х(X, Ю) / p( X). Үүнд: "Охих магадлал цагтхүрээнд Xнэгэн зэрэг цохих магадлалын харьцаатай тэнцүү хүрээг цохих Xхүрээнд болон цагтхүрээ рүү, цохих магадлал руу Xхүрээнд."

Үүнтэй адилтгаж, магадлалыг авч үзье х(X|Ю). Бид хосуудыг дууддаг ( x, y) мөн эдгээрийг шүүнэ үү y 0.5-аас 0.7 хооронд байвал магадлал xгэсэн тохиолдолд интервалд байна yсегментэд хамаарах нь 3-р бүсийн талбайн ногоон бүсийн 2-ын талбайн харьцаатай тэнцүү байна. х(X|Ю) = х(X, Ю) / х(Ю).

магадлал гэдгийг анхаарна уу х(X, Ю) Мөн х(Y, X) тэнцүү бөгөөд хоёулаа 3-р бүсийн талбайг бүхэл бүтэн квадратын талбайн харьцаатай тэнцүү, гэхдээ магадлал х(Ю|X) Мөн х(X|Ю) тэнцүү биш; магадлал байхад х(Ю|X) нь 3-р бүсийн талбайн 1-р бүстэй харьцуулсан харьцаатай тэнцүү байна х(X|Ю) – 3-р бүсээс 2-р бүс хүртэл. Мөн анхаарна уу х(X, Ю) гэж ихэвчлэн тэмдэглэдэг х(X&Ю).

Тиймээс бид хоёр тодорхойлолтыг танилцуулав: х(Ю|X) = х(X, Ю) / p( X) Мөн х(X|Ю) = х(X, Ю) / х(Ю)

Эдгээр тэгш байдлыг дараах хэлбэрээр дахин бичье. х(X, Ю) = х(Ю|X) * p( X) Мөн х(X, Ю) = х(X|Ю) * х(Ю)

Зүүн талууд тэнцүү тул баруун талууд нь тэнцүү байна: х(Ю|X) * p( X) = х(X|Ю) * х(Ю)

Эсвэл бид сүүлчийн тэгш байдлыг дараах байдлаар дахин бичиж болно.

Энэ бол Бэйсийн теорем!

Ийм энгийн (бараг тавтологийн) хувиргалтууд үнэхээр агуу теоремыг бий болгож байна уу!? Дүгнэлт хийх гэж яарах хэрэггүй. Бид юу авсан талаар дахин ярилцъя. Тодорхой анхны (а априори) магадлал байсан r(X), санамсаргүй хэмжигдэхүүн Xсегментэд жигд тархсан нь мужид багтдаг X. Үйл явдал болсон Ю, үүний үр дүнд бид ижил санамсаргүй хэмжигдэхүүний арын магадлалыг авсан X: r(X|Y) бөгөөд энэ магадлал нь ялгаатай байна r(X) коэффициентээр. Үйл явдал Юнотлох баримт гэж нэрлэгддэг, их бага хэмжээгээр батлах эсвэл үгүйсгэх X. Энэ коэффициентийг заримдаа гэж нэрлэдэг нотлох баримтын хүч. Нотлох баримт нь хүчтэй байх тусам Y-г ажигласан баримт өмнөх магадлалыг өөрчлөх тусам арын магадлал өмнөхөөсөө ялгаатай байна. Хэрэв нотлох баримт сул байвал арын магадлал өмнөхтэй бараг тэнцүү байна.

Дискрет санамсаргүй хэмжигдэхүүнүүдийн Бэйсийн томъёо

Өмнөх хэсэгт бид интервал дээр тодорхойлсон x ба y тасралтгүй санамсаргүй хэмжигдэхүүнүүдийн хувьд Bayes-ийн томъёог гаргаж авсан. Тус бүр нь хоёр боломжит утгыг авсан салангид санамсаргүй хэмжигдэхүүнтэй жишээг авч үзье. Эмнэлгийн ердийн үзлэгээр дөчин настай эмэгтэйчүүдийн 1% нь хөхний хорт хавдраар өвчилдөг болохыг тогтоожээ. Хорт хавдартай эмэгтэйчүүдийн 80% нь маммографийн эерэг үр дүнг авдаг. Эрүүл эмэгтэйчүүдийн 9.6% нь маммографийн эерэг үр дүнг авдаг. Шалгалтын үеэр энэ насны эмэгтэйд маммографийн эерэг үр дүн гарсан. Тэр үнэхээр хөхний хорт хавдартай байх магадлал хэр вэ?

Үндэслэл/тооцооллын шугам нь дараах байдалтай байна. Хорт хавдартай өвчтөнүүдийн 1% -д маммографи эерэг үр дүн өгнө = 1% * 80% = 0.8%. Эрүүл эмэгтэйчүүдийн 99% нь маммографи 9.6% эерэг үр дүн = 99% * 9.6% = 9.504% өгнө. Нийт 10.304% (9.504% + 0.8%) маммографийн эерэг үр дүн гарсан бөгөөд зөвхөн 0.8% нь өвчтэй, үлдсэн 9.504% нь эрүүл байна. Тиймээс маммограмм эерэг гарсан эмэгтэйд хорт хавдар тусах магадлал 0.8% / 10.304% = 7.764% байна. Та 80% эсвэл тийм гэж бодсон уу?

Бидний жишээн дээр Bayes томъёо дараах хэлбэртэй байна.

Энэ томъёоны "физик" утгын талаар дахин ярилцъя. X- санамсаргүй хэмжигдэхүүн (оношлогоо), утгыг авах: X 1- өвчтэй ба X 2- эрүүл; Ю– санамсаргүй хэмжигдэхүүн (хэмжилтийн үр дүн – маммограф), утгыг авах: Ү 1- эерэг үр дүн ба Y2- сөрөг үр дүн; p(X 1)– маммографийн өмнө өвчний магадлал (априори магадлал) 1% -тай тэнцүү; p(Ю 1 |X 1 ) - өвчтөн өвчтэй бол эерэг үр дүн гарах магадлал (нөхцөлт магадлал, учир нь энэ нь даалгаврын нөхцөлд тусгагдсан байх ёстой) 80% -тай тэнцүү; p(Ю 1 |X 2 ) – өвчтөн эрүүл бол эерэг үр дүн гарах магадлал (мөн нөхцөлт магадлал) 9.6%; p(X 2)– маммографийн өмнө өвчтөн эрүүл байх магадлал (априори магадлал) 99%; p(X 1|Ю 1 ) – маммографийн эерэг үр дүнг өгсөн өвчтөн өвчтэй байх магадлал (арын магадлал).

Арын магадлал (бидний хайж байгаа зүйл) нь арай илүү төвөгтэй коэффициенттэй өмнөх магадлал (анхны) пропорциональ байгааг харж болно. . Дахин онцолж хэлье. Миний бодлоор энэ бол Байесийн хандлагын үндсэн тал юм. Хэмжилт ( Ю) тухайн объектын талаарх бидний мэдлэгийг тодруулсан анхны мэдээлэл (apriori) дээр тодорхой хэмжээний мэдээлэл нэмсэн.

Жишээ

Хамтарсан материалаа нэгтгэхийн тулд хэд хэдэн асуудлыг шийдэж үзээрэй.

Жишээ 1. 3 сав байна; эхнийх нь 3 цагаан бөмбөг, 1 хар; хоёр дахь нь - 2 цагаан бөмбөг, 3 хар; Гурав дахь нь 3 цагаан бөмбөг байна. Хэн нэгэн савны аль нэгэнд санамсаргүй байдлаар ойртож, тэндээс 1 бөмбөг гаргаж авдаг. Энэ бөмбөг цагаан өнгөтэй болсон. Бөмбөгийг 1, 2, 3-р савнаас татаж авсан арын магадлалыг ол.

Шийдэл. Бид гурван таамаглалтай: H 1 = (эхний савыг сонгосон), H 2 = (хоёр дахь савыг сонгосон), H 3 = (гурав дахь савыг сонгосон). Урныг санамсаргүй байдлаар сонгосон тул таамаглалын априори магадлал тэнцүү байна: P(H 1) = P (H 2) = P (H 3) = 1/3.

Туршилтын үр дүнд А = үйл явдал гарч ирэв (сонгосон савнаас цагаан бөмбөг зурсан). H 1, H 2, H 3 таамаглалын дагуу А үйл явдлын нөхцөлт магадлал: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Жишээлбэл, эхний тэгш байдал нь "эхний савыг сонгосон тохиолдолд цагаан бөмбөг зурах магадлал 3/4 байна (эхний саванд 4 бөмбөг байгаа бөгөөд тэдгээрийн 3 нь цагаан өнгөтэй байдаг)" гэсэн утгатай.

Бэйсийн томьёог ашиглан бид таамаглалын арын магадлалыг олно.

Ийнхүү А үйл явдал тохиолдсон тухай мэдээлэлд үндэслэн таамаглалуудын магадлал өөрчлөгдсөн: H 3 таамаглал хамгийн их магадлалтай, H 2 таамаглал хамгийн бага магадлалтай болсон.

Жишээ 2.Хоёр мэргэн буудагч нэг бай руу бие даан буудаж, тус бүр нэг удаа бууддаг. Эхний мэргэн буучийн хувьд бай онох магадлал 0.8, хоёр дахь нь 0.4 байна. Буудсаны дараа зорилтот хэсэгт нэг нүх олдсон. Энэ нүх нь эхний мэргэн буучийнх байх магадлалыг ол (Үр дүн (хоёр нүх давхцсан) магадлал багатай тул хаясан).

Шийдэл. Туршилтын өмнө дараахь таамаглал дэвшүүлж болно: H 1 = (эхний ч, хоёр дахь сум ч онохгүй), H 2 = (хоёул сум онох болно), H 3 - (эхний мэргэн буудагч онох боловч хоёр дахь нь онохгүй. ), H 4 = (эхний мэргэн бууч онохгүй, хоёр дахь нь онох болно). Таамаглалын өмнөх магадлал:

P(H 1) = 0.2*0.6 = 0.12; P(H2) = 0.8*0.4 = 0.32; P (H 3) = 0.8 * 0.6 = 0.48; P(H 4) = 0.2*0.4 = 0.08.

Эдгээр таамаглалуудын дагуу ажиглагдсан үйл явдлын нөхцөлт магадлал A = (зорилтонд нэг нүх байна) тэнцүү байна: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Туршилтын дараа H 1 ба H 2 таамаглалууд боломжгүй болж, Бэйсийн томъёоны дагуу H 3 ба H 4 таамаглалуудын арын магадлал дараах байдалтай байна.

Спамын эсрэг

Bayes-ийн томъёо нь спам шүүлтүүрийг боловсруулахад өргөн хэрэглэгддэг. Та аль имэйлийг спам болохыг тодорхойлохын тулд компьютер сургахыг хүсч байна гэж бодъё. Бид Байесийн тооцооллыг ашиглан толь бичиг, хэллэгийг үргэлжлүүлнэ. Эхлээд таамаглалын орон зайг бий болгоё. Аливаа үсгийн талаар хоёр таамаг дэвшүүлье: H A бол спам, H B бол спам биш, харин ердийн, шаардлагатай үсэг.

Эхлээд спамын эсрэг ирээдүйн системээ "сургаж" үзье. Өөрт байгаа бүх үсгээ аваад тус бүр нь 10 үсэгтэй хоёр “овоо” болгоё. Нэгд нь спам имэйлийг оруулаад H A овоолго, нөгөөд нь шаардлагатай захидал харилцааг H B овоолго гэж нэрлэе. Одоо харцгаая: спам, шаардлагатай үсэгнээс ямар үг, хэллэг, ямар давтамжтай байдаг вэ? Бид эдгээр үг, хэллэгийг нотлох баримт гэж нэрлээд E 1 , E 2 гэж тэмдэглэнэ ... H A ба H B овоолгуудад түгээмэл хэрэглэгддэг үгс (жишээлбэл, "дуртай", "таны" гэсэн үгс) ойролцоогоор гарч ирдэг. ижил давтамж. Тиймээс захидалд эдгээр үгс байгаа нь түүнийг аль овоолго руу хуваарилах талаар юу ч хэлж чадахгүй (сул нотлох баримт). Эдгээр үгсийг төвийг сахисан "спам" магадлалын оноог 0.5 гэж тооцъё.

"Ярианы англи хэл" гэсэн хэллэгийг зөвхөн 10 үсгээр, спам үсгээр (жишээ нь, бүх 10 спам үсгийн 7-д) шаардлагатай (10-аас 3-т) үсгээр бичнэ. Энэ хэллэгт спамын хувьд илүү өндөр үнэлгээ өгье: 7/10, энгийн имэйлийн хувьд бага үнэлгээ: 3/10. Үүний эсрэгээр, "найз" гэдэг үг ердийн үсгүүдэд илүү түгээмэл байдаг (10-аас 6). Тэгээд бид богино захидал хүлээн авлаа: “Найз минь! Чиний англи хэл хэр байна?". Түүний "спамми" байдлыг үнэлэхийг хичээцгээе. Бид овоо бүрд хамаарах үсгийн ерөнхий тооцооллыг P(H A), P(H B)-ийг бага зэрэг хялбаршуулсан Bayes томьёо болон ойролцоо тооцооллыг ашиглан өгнө.

P(H A) = A/(A+B), Хаана A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

Хүснэгт 1. Хялбаршуулсан (болон бүрэн бус) Бэйсийн бичих тооцоо.

Тиймээс бидний таамагласан захидал "спам"-ыг онцолсон оноо авах магадлалыг авсан. Бид захидлыг нэг овоолго руу хаяхаар шийдэж чадах уу? Шийдвэр гаргах босгыг тогтооцгооё:

  • Хэрэв P(H i) ≥ T байвал үсэг нь H i овоолгод хамаарна гэж бид үзнэ.
  • Хэрэв P(H i) ≤ L байвал үсэг нь овоолгод хамаарахгүй.
  • Хэрэв L ≤ P(H i) ≤ T байвал шийдвэр гаргах боломжгүй.

Та T = 0.95 ба L = 0.05-ыг авч болно. Учир нь тухайн захидлын хувьд болон 0.05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Тиймээ. Бэйсийн бодитой санал болгосон шиг нотлох баримт бүрийн оноог өөр аргаар тооцъё. зөвшөөрөх:

F a нь спам имэйлийн нийт тоо;

F ai нь гэрчилгээтэй үсгийн тоо юм бибөөн спам дотор;

F b - шаардлагатай үсгийн нийт тоо;

F bi нь гэрчилгээтэй үсгийн тоо юм бишаардлагатай (холбогдох) үсгээр.

Дараа нь: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), Хаана A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Нотлох баримтын p ai, p bi гэсэн үгсийн үнэлгээ нь бодитой болж, хүний ​​оролцоогүйгээр тооцоолох боломжтой гэдгийг анхаарна уу.

Хүснэгт 2. Захидал дахь боломжит шинж чанарууд дээр үндэслэн Бэйсийн тооцооллыг илүү нарийвчлалтай (гэхдээ бүрэн бус).

Бид маш тодорхой үр дүнг хүлээн авсан - том давуу талтай, үсэг P(H B) = 0.997> T = 0.95 тул хүссэн үсэг гэж ангилж болно. Үр дүн яагаад өөрчлөгдсөн бэ? Бид илүү их мэдээлэл ашигласан тул овоолго бүрийн үсгийн тоог харгалзан үзсэн бөгөөд дашрамд хэлэхэд p ai ба p bi гэсэн тооцоог илүү зөв тодорхойлсон. Бид нөхцөлт магадлалыг тооцоолох замаар Бэйсийн өөрийнх нь адилаар тэдгээрийг тодорхойлсон. Өөрөөр хэлбэл, p a3 нь захидалд "найз" гэсэн үг гарч ирэх магадлал бөгөөд хэрэв энэ захидал аль хэдийн H A спам овоолгод харьяалагддаг бол. Үр дүн нь тийм ч удаан байсангүй - бид илүү итгэлтэйгээр шийдвэр гаргах боломжтой юм шиг байна.

Байс компанийн луйврын эсрэг

Bayesian аргын нэгэн сонирхолтой хэрэглээг MAGNUS8 тайлбарлав.

Миний одоогийн төсөл (үйлдвэрлэлийн аж ахуйн нэгжийн луйврыг илрүүлэх IS) нь залилан хийх боломжтой гэсэн таамаглалыг шууд бусаар гэрчлэх хэд хэдэн баримт байгаа / байхгүй үед луйвар (луйвар) гарах магадлалыг тодорхойлохын тулд Bayes томъёог ашигладаг. Алгоритм нь өөрөө суралцдаг (санал хүсэлттэй), i.e. эдийн засгийн аюулгүй байдлын алба шалгах явцад луйврыг бодитоор баталгаажуулсан эсвэл нотлогдоогүй тохиолдолд түүний коэффициентийг (нөхцөлт магадлал) дахин тооцоолно.

Алгоритм зохиохдоо ийм аргууд нь хөгжүүлэгчээс нэлээд өндөр математикийн соёл шаарддаг гэдгийг хэлэх нь зүйтэй болов уу. Тооцооллын томъёог гаргаж авах ба/эсвэл хэрэгжүүлэхэд гарсан өчүүхэн төдий алдаа нь бүхэл бүтэн аргыг хүчингүй болгож, гутаан доромжлох болно. Хүний сэтгэлгээ нь магадлалын ангилалтай ажиллахад дасан зохицдоггүй тул завсрын болон эцсийн магадлалын параметрүүдийн "бие махбодийн утгыг" ойлгох "харагдах байдал" байхгүй тул магадлалын аргууд үүнд онцгой өртөмтгий байдаг. Энэ ойлголт нь зөвхөн магадлалын онолын үндсэн ойлголтуудад л байдаг бөгөөд дараа нь та магадлалын онолын хуулийн дагуу нарийн төвөгтэй зүйлсийг маш болгоомжтой нэгтгэж, гаргаж авах хэрэгтэй - нийтлэг ойлголт нь нийлмэл объектуудад туслахаа болино. Энэ нь ялангуяа магадлалын философийн талаархи орчин үеийн номнуудын хуудсан дээр нэлээд ноцтой арга зүйн тулалдаан, мөн энэ сэдвээр олон тооны софизм, парадокс, сониуч таавартай холбоотой юм.

Надад тулгарсан өөр нэг нюанс бол харамсалтай нь энэ сэдвээр ПРАКТИКТ АШИГТАЙ бараг бүх зүйл англи хэл дээр бичигдсэн байдаг. Орос хэл дээрх эх сурвалжуудад зөвхөн хамгийн анхдагч тохиолдлуудад үзүүлэх жишээнүүдийг агуулсан алдартай онол байдаг.

Би сүүлчийн тайлбартай бүрэн санал нийлж байна. Жишээлбэл, Google "Байесийн магадлал" гэх мэт зүйлийг хайж олоход ойлгомжтой зүйл гаргаж чадаагүй. Хятадад Байесийн статистик бүхий номыг хориглосон гэж тэр мэдээлсэн нь үнэн. (Статистикийн профессор Эндрю Гельман Колумбын Их Сургуулийн блог дээр түүний "Regression and Multilevel/Ierarchical Models бүхий Өгөгдлийн Анализ" номыг Хятадад хэвлэхийг хориглосон тухай мэдээлсэн. Тэндхийн хэвлэн нийтлэгч "Улс төрийн янз бүрийн мэдрэмжийн улмаас энэ номыг эрх баригчид зөвшөөрөөгүй" гэж мэдээлэв. Текст дэх материал.") Үүнтэй төстэй шалтгаан нь Орост Байесийн магадлалын тухай ном байхгүй болоход хүргэсэн болов уу?

Хүний мэдээллийг боловсруулах консерватизм

Магадлал нь тодорхойгүй байдлын түвшинг тодорхойлдог. Магадлал нь Бэйсийн болон бидний зөн совингийн аль алиных нь үзэж байгаагаар бол зүгээр л тэг ба түүний хоорондох тоо бөгөөд энэ нь зарим талаараа идеалчлагдсан хүн уг мэдэгдлийг үнэн гэдэгт итгэх түвшинг илэрхийлдэг. Хүн зарим талаараа идеалчлагдсан байдаг шалтгаан нь түүний бие биенээ үгүйсгэдэг хоёр үйл явдлын магадлалын нийлбэр нь түүний аль нэг үйл явдал болох магадлалтай тэнцүү байх ёстой. Нэмэлт шинж чанар нь ийм үр дагавартай тул цөөхөн бодит хүмүүс бүгдийг нь хангаж чаддаг.

Байесийн теорем нь нэмэлт магадлалын шинж чанарын өчүүхэн үр дагавар бөгөөд маргаангүй бөгөөд бүх магадлалчид, Байесийн болон бусад хүмүүсийн тохиролцсон байдаг. Үүнийг бичих нэг арга бол дараах байдалтай байна. Хэрэв P(H A |D) нь өгөгдсөн D утгыг ажигласны дараа А таамаглал байх дараагийн магадлал, P(H A) нь D утга ажиглагдахаас өмнөх өмнөх магадлал, P(D|H A ) нь a гэсэн магадлал юм. Хэрэв H A үнэн, P(D) нь өгөгдсөн D утгын болзолгүй магадлал бол өгөгдсөн D утга ажиглагдах болно.

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D)-ийг авч үзэж буй бие биенээ үгүйсгэсэн таамаглалуудын бүрэн багц дээр арын магадлалыг нэгтгэхэд хүргэдэг хэвийн болгох тогтмол гэж хамгийн сайн ойлгодог. Үүнийг тооцоолох шаардлагатай бол дараах байдалтай байж болно.

Гэхдээ ихэвчлэн P (D) -ийг тооцоолохын оронд хасдаг. Үүнийг арилгах тохиромжтой арга бол Байесийн теоремыг магадлалын харьцаа хэлбэрт шилжүүлэх явдал юм.

H A-тай харилцан хамааралгүй H B гэсэн өөр таамаглалыг авч үзээд H A-ийн талаарх таны бодлыг өөрчилсөн өгөгдсөн хэмжигдэхүүн дээр үндэслэн энэ тухай бодлоо өөрчил

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Одоо 1-р тэгшитгэлийг 2-т хуваая; үр дүн нь иймэрхүү байх болно:

Энд Ω 1 нь H A-аас H B хүртэлх арын магадлал, Ω 0 нь өмнөх магадлал, L нь магадлалын харьцаа гэж статистикчдад танил болсон хэмжигдэхүүн юм. 3-р тэгшитгэл нь Бэйсийн теоремын 1-р тэгшитгэлтэй ижил хамааралтай хувилбар бөгөөд ялангуяа таамаглал бүхий туршилтуудад илүү ашигтай байдаг. Байесистууд Бэйсийн теорем нь шинэ нотолгоонд тулгуурлан үзэл бодлоо хэрхэн засах тухай албан ёсны оновчтой дүрэм гэж үздэг.

Бид Байесийн теоремоор тодорхойлсон идеал зан үйлийг хүмүүсийн бодит зан үйлтэй харьцуулахыг сонирхож байна. Энэ нь юу гэсэн үг болохыг ойлгохын тулд тантай туршилт хийж үзье. Энэ уутанд 1000 покер чип багтсан. Надад ийм хоёр уут байгаа бөгөөд нэг нь 700 улаан, 300 цэнхэр чипс, нөгөөд нь 300 улаан, 700 цэнхэр чипс байдаг. Би зоос шидээд алийг нь хэрэглэхээ шийдлээ. Тэгэхээр, хэрэв бидний бодол ижил байвал таны одоогийн байдлаар илүү улаан чипс агуулсан уут авах магадлал 0.5 байна. Одоо та чип бүрийн дараа өгөөжтэй санамсаргүй түүвэр хийнэ. 12 чипэнд 8 улаан, 4 цэнхэр өнгөтэй болно. Одоо таны мэддэг бүх зүйл дээр үндэслэн хамгийн олон улаантай цүнхийг буух магадлал хэд вэ? 0.5-аас дээш байгаа нь тодорхой байна. Та оноогоо бичиж дуустал үргэлжлүүлэн уншиж болохгүй.

Хэрэв та жирийн нэгэн сорилттой адил бол таны оноо 0.7-0.8 хооронд буурсан байна. Хэрэв бид тохирох тооцоог хийвэл хариулт нь 0.97 байх болно. Байесийн теоремыг мэддэг байсан ч консерватизмын нөлөөг урьд өмнө нь харуулж байгаагүй хүн ийм өндөр үнэлгээ авах нь үнэхээр ховор байдаг.

Хэрэв уутанд улаан чипсийн эзлэх хувь r, дараа нь хүлээн авах магадлал rулаан чипс ба ( n -r) цэнхэр nбуцаан олголттой дээж - p r (1–p)n-r. Тэгэхээр, цүнх болон покер чипс нь ердийн туршилтанд, хэрэв НАулаан чипсийн эзлэх хувь байна гэсэн үг р АТэгээд НБ– хувьцаа байна гэсэн үг rБ, тэгвэл магадлалын харьцаа:

Байесийн томьёог хэрэглэхдээ түүний хийсэн боловч хийгээгүй бусад ажиглалтын магадлалыг бус зөвхөн бодит ажиглалтын магадлалыг авч үзэх хэрэгтэй. Энэ зарчим нь Бэйсийн теоремын статистик болон статистикийн бус хэрэглээнд өргөн нөлөө үзүүлдэг; Энэ нь Байесийн сэтгэхүйн хамгийн чухал техникийн хэрэгсэл юм.

Байесын хувьсгал

Таны найз нөхөд, хамтран ажиллагсад "Бэйсийн теорем" эсвэл "Бэйсийн дүрэм" эсвэл Байесийн үндэслэл гэж нэрлэгддэг зүйлийн талаар ярьж байна. Тэд үүнийг үнэхээр сонирхож байгаа тул та интернетэд ороод Бэйсийн теоремын тухай хуудсыг олоод... Энэ бол тэгшитгэл юм. Ингээд л болоо... Математикийн ойлголт яагаад оюун санаанд ийм урам зоригийг бий болгодог вэ? Эрдэмтдийн дунд ямар төрлийн "Байезийн хувьсгал" болж байгаа бөгөөд туршилтын аргыг хүртэл түүний онцгой тохиолдол гэж тодорхойлж болно гэж маргаж байна вэ? Байесчуудын мэддэг нууц юу вэ? Тэд ямар гэрлийг харж байна вэ?

Шинжлэх ухаанд Байесын хувьсгал болоогүй, учир нь улам олон танин мэдэхүйн эрдэмтэд сэтгэцийн үзэгдлүүд Байесийн бүтэцтэй болохыг гэнэт анзаарч эхэлсэн; Салбар бүрийн эрдэмтэд Байезийн аргыг хэрэглэж эхэлснээс биш; гэхдээ шинжлэх ухаан өөрөө Бэйсийн теоремын онцгой тохиолдол учраас; туршилтын нотолгоо бол Байесын нотолгоо юм. Байесын хувьсгалчид туршилт хийж, таны онолыг "баталгаажуулж" эсвэл "няцаах" нотлох баримтыг олж авбал тэрхүү баталгаажуулалт эсвэл няцаалт нь Байесийн дүрмийн дагуу явагддаг гэж маргадаг. Жишээлбэл, таны онол аливаа үзэгдлийг тайлбарлахаас гадна тухайн үзэгдлийг урьдчилан таамаглах боломжтой бусад тайлбарууд байдаг гэдгийг анхаарч үзэх хэрэгтэй.

Өмнө нь шинжлэх ухааны хамгийн алдартай философи бол Байесийн хувьсгалаар солигдсон хуучин философи байв. Карл Попперын онолыг бүрэн худалчлах боломжтой боловч хэзээ ч бүрэн баталгаажуулахгүй гэсэн санаа бол Байезийн дүрмийн өөр нэг онцгой тохиолдол юм; хэрэв p(X|A) ≈ 1 – хэрэв онол нь зөв таамаглал дэвшүүлбэл, ~X-г ажиглах нь А-г маш хүчтэй худал болгодог. Нөгөө талаас, хэрэв p(X|A) ≈ 1-ийг ажиглавал энэ нь баттай батлагдаагүй болно. онол; p(X|B) ≈ 1 гэсэн өөр ямар нэг В нөхцөл боломжтой байж болох бөгөөд үүний дагуу X ажиглалт А-ийн талд биш харин В-ийн талд гэрчилнэ. Х ажиглалт А-г баттай батлахын тулд бид дараах зүйлийг хийх ёстой. p(X|A) ≈ 1 ба p(X|~A) ≈ 0 гэдгийг бид мэдэхгүй, учир нь бид бүх боломжит хувилбаруудыг авч үзэх боломжгүй. Жишээлбэл, Эйнштейний харьцангуйн ерөнхий онол нь Ньютоны сайн дэмжигдсэн таталцлын онолыг давж гарахдаа Ньютоны онолын бүх таамаглалыг Эйнштейний таамаглалын онцгой тохиолдол болгосон.

Үүнтэй адилаар Попперын санааг худалчлах ёстой гэсэн санааг Байесын магадлалыг хадгалах дүрмийн илрэл гэж тайлбарлаж болно; Хэрэв X үр дүн онолын эерэг нотолгоо бол ~X үр дүн онолыг тодорхой хэмжээгээр үгүйсгэх ёстой. Хэрэв та X ба ~X-ийг хоёуланг нь онолыг "баталгааж байна" гэж тайлбарлахыг оролдвол Байезийн дүрмүүд үүнийг боломжгүй гэж үздэг! Онолын магадлалыг нэмэгдүүлэхийн тулд та онолын магадлалыг бууруулж болох туршилтанд хамрагдах ёстой; Энэ бол шинжлэх ухаан дахь шарлатануудыг тодорхойлох дүрэм биш, харин Байезийн магадлалын теоремын үр дагавар юм. Нөгөөтэйгүүр, зөвхөн хуурамчаар үйлдэх хэрэгтэй, баталгаажуулах шаардлагагүй гэсэн Попперын санаа буруу юм. Бэйсийн теорем нь хуурамчаар үйлдэх нь батлахтай харьцуулахад маш хүчтэй нотолгоо гэдгийг харуулж байгаа боловч хуурамчаар үйлдэх нь магадлалын шинж чанартай хэвээр байна; энэ нь үндсэндээ өөр дүрмээр зохицуулагддаггүй бөгөөд Попперын хэлснээр баталгаажуулахаас ялгаагүй юм.

Тиймээс танин мэдэхүйн шинжлэх ухааны олон үзэгдлүүд, эрдэмтдийн ашигладаг статистик аргууд, шинжлэх ухааны арга нь бүгд Бэйсийн теоремын онцгой тохиолдлууд болохыг бид олж мэдсэн. Энэ бол Байезийн хувьсгал юм.

Bayesian Conspiracy-д тавтай морил!

Байесийн магадлалын талаархи уран зохиол

2. Эдийн засгийн салбарын Нобелийн шагналт Каннеман (ба түүний нөхдүүд) Бэйсийн олон төрлийн хэрэглээг гайхалтай номондоо дүрсэлсэн байдаг. Зөвхөн энэ маш том номын тухай товч хураангуйдаа би Пресвитериан сайдын нэрийг 27 удаа дурьдсаныг тоолсон. Хамгийн бага томъёо. (.. Надад үнэхээр таалагдсан. Үнэн, энэ нь жаахан төвөгтэй, маш олон математик байдаг (мөн үүнгүйгээр бид хаана байх байсан бэ), гэхдээ тусдаа бүлгүүд (жишээ нь, 4-р бүлэг. Мэдээлэл) сэдвээр тодорхой байна. Би үүнийг санал болгож байна. Математик танд хэцүү байсан ч бусад мөр бүрийг уншиж, математикийг алгасаж, ашигтай үр тариа хайж олоорой ...

14. (2017 оны 1-р сарын 15-ны өдрийн нэмэлт), Тони Криллигийн номны нэг бүлэг. Таны мэдэх ёстой 50 санаа. Математик.

Нобелийн шагналт физикч Ричард Фейнман нэгэн гүн ухаантны тухай ярихдаа: "Намайг бухимдуулж байгаа зүйл бол шинжлэх ухааны хувьд философи биш, харин түүний эргэн тойронд бий болсон сүр жавхлант байдал юм. Философичид өөрсдийгөө шоолж инээдэг болоосой! Хэрэв тэд: "Би үүнийг ийм байна гэж хэлж байна, гэхдээ фон Лейпциг үүнийг өөр гэж бодсон, тэр бас энэ талаар ямар нэг юм мэддэг" гэж хэлж чадвал. Зөвхөн тэднийх гэдгийг тодруулахаа санаж байсан бол .

Нэг жишээгээр эхэлье. Таны өмнө байгаа саванд, тэнцүү магадлалтай(1) хоёр цагаан бөмбөг, (2) нэг цагаан, нэг хар, (3) хоёр хар байж болно. Бөмбөгийг чирч, цагаан өнгөтэй болно. Та одоо үүнийг хэрхэн үнэлэх вэ? магадлалЭдгээр гурван сонголт (таамаглал)? Мэдээжийн хэрэг, хоёр хар бөмбөлөгтэй таамаглал (3) гарах магадлал = 0. Харин үлдсэн хоёр таамаглалын магадлалыг хэрхэн тооцох вэ!? Үүнийг Байесийн томъёогоор хийж болох бөгөөд энэ нь манай тохиолдолд ийм хэлбэртэй байдаг (томъёоны тоо нь шалгаж буй таамаглалын тоотой тохирч байна):

Тэмдэглэлийг эсвэл дотор татаж авна уу

X– дараах утгуудыг авсан санамсаргүй хэмжигдэхүүн (таамаглал): x 1- хоёр цагаан, x 2- нэг цагаан, нэг хар; x 3- хоёр хар; цагт– утгыг авах санамсаргүй хэмжигдэхүүн (үйл явдал): 1 цагт– цагаан бөмбөг сугалж, 2 цагт- хар бөмбөг сугалж байна; P(x 1)- бөмбөг зурахаас өмнөх эхний таамаглалын магадлал ( априоримагадлал эсвэл магадлал руутуршлага) = 1/3; P(x 2)– бөмбөгийг татахаас өмнөх хоёр дахь таамаглалын магадлал = 1/3; P(x 3)– бөмбөгийг зурахаас өмнөх гурав дахь таамаглалын магадлал = 1/3; P(y 1|x 1)– эхний таамаглал үнэн бол цагаан бөмбөг зурах нөхцөлт магадлал (бөмбөг цагаан өнгөтэй) = 1; P(y 1|x 2)Хоёрдахь таамаглал үнэн бол цагаан бөмбөг зурах магадлал (нэг бөмбөг цагаан, хоёр дахь нь хар) = ½; P(y 1|x 3)Гурав дахь таамаглал үнэн бол цагаан бөмбөг зурах магадлал (хоёулаа хар) = 0; P(y 1)– цагаан бөмбөг зурах магадлал = ½; R(y2)– хар бөмбөг зурах магадлал = ½; эцэст нь бидний хайж байгаа зүйл - P(x 1|y 1)Эхний таамаглал үнэн байх магадлал (хоёр бөмбөг цагаан), бид цагаан бөмбөг зурсан ( a posterioriмагадлал эсвэл магадлал дараатуршлага); P(x 2|y 1)Бид цагаан бөмбөг зурсан тохиолдолд хоёр дахь таамаглал үнэн байх магадлал (нэг бөмбөг цагаан, хоёр дахь нь хар).

Бид цагаан бөмбөг зурсан тул эхний таамаглал (хоёр цагаан) үнэн байх магадлал:

Хоёр дахь таамаглал үнэн байх магадлал (нэг нь цагаан, нөгөө нь хар), хэрэв бид цагаан бөмбөг зурсан бол:

Гурав дахь таамаглал үнэн байх магадлал (хоёр хар), бид цагаан бөмбөг зурсан:

Бэйсийн томъёо юу хийдэг вэ? Энэ нь таамаглалын априори магадлал дээр үндэслэн боломжтой болгодог. P(x 1), P(x 2), P(x 3)- болон тохиолдох үйл явдлын магадлал - P(y 1), R(y2)– таамаглалын арын магадлалыг тооцоолох, жишээлбэл, цагаан бөмбөг зурсан тохиолдолд эхний таамаглалын магадлалыг тооцоолох; P(x 1|y 1).

Дахин нэг удаа томъёо (1) рүү буцъя. Эхний таамаглалын анхны магадлал нь байсан P(x 1) = 1/3. Магадлалтай P(y 1) = 1/2Бид магадгүй цагаан бөмбөг зурж болно P(y 2) = 1/2- хар. Бид цагааныг нь сугалж авлаа. Эхний таамаг үнэн бол цагаанаар зурах магадлал P(y 1|x 1) = 1.Бэйсийн томъёонд цагаан зурсанаас хойш эхний таамаглалын магадлал 2/3 болж өссөн, хоёр дахь таамаглалын магадлал 1/3 хэвээр, гурав дахь таамаглалын магадлал тэг болсон байна.

Хэрэв бид хар бөмбөг гаргавал арын магадлал тэгш хэмтэйгээр өөрчлөгдөхийг шалгахад хялбар байдаг. P(x 1|y 2) = 0, P(x 2|y 2) = 1/3, P(x 3|y 2) = 2/3.

Пьер Саймон Лаплас 1814 онд хэвлэгдсэн бүтээлдээ Байесийн томъёоны талаар юу гэж бичжээ.

Энэ бол үйл явдлаас шалтгаан руу шилжих шилжилтийг авч үздэг гэнэтийн байдлын шинжилгээний тэр салбарын үндсэн зарчим юм.

Бэйсийн томъёог ойлгоход яагаад ийм хэцүү байдаг юм бэ!? Миний бодлоор бол бидний ердийн хандлага бол шалтгаанаас үр дагавар руу чиглэсэн үндэслэл юм. Жишээлбэл, нэг саванд 36 бөмбөг байгаа бол тэдгээрийн 6 нь хар, үлдсэн нь цагаан өнгөтэй байна. Цагаан бөмбөг зурах магадлал хэд вэ? Байесийн томъёо нь үйл явдлуудаас шалтгаан (таамаглал) руу шилжих боломжийг олгодог. Хэрэв бид гурван таамаглалтай байсан бөгөөд ямар нэгэн үйл явдал болсон бол тухайн үйл явдал (өөр хувилбар биш) таамаглалын эхний магадлалд хэрхэн нөлөөлсөн бэ? Эдгээр магадлал хэрхэн өөрчлөгдсөн бэ?

Бэйсийн томъёо нь зөвхөн магадлалын тухай биш гэдэгт би итгэдэг. Энэ нь ойлголтын парадигмыг өөрчилдөг. Детерминист парадигмыг ашиглах үед бодлын үйл явц юу вэ? Хэрэв ямар нэгэн үйл явдал болсон бол түүний шалтгаан юу байсан бэ? Хэрэв осол, онцгой байдал, цэргийн мөргөлдөөн гарсан бол. Тэдний буруу хэн байсан бэ? Байесийн ажиглагч юу гэж боддог вэ? Юунд хүргэсэн бодит байдлын бүтэц өгсөнтохиолдлын ийм ийм илрэл ... Bayesian үүнийг ойлгодог өөрөөрЭнэ тохиолдолд үр дүн нь өөр байж болно ...

Томъёо (1) ба (2) дахь тэмдгүүдийг арай өөрөөр байрлуулъя:

Харж байгаа зүйлийнхээ талаар дахин ярилцъя. Анхны (априори) магадлал тэнцүү бол гурван таамаглалын аль нэг нь үнэн байж болно. Тэнцүү магадлалаар бид цагаан эсвэл хар бөмбөг зурж болно. Бид цагааныг нь сугалж авлаа. Энэхүү шинэ нэмэлт мэдээлэлд үндэслэн бидний таамаглалуудын үнэлгээг дахин авч үзэх хэрэгтэй. Bayes-ийн томъёо нь үүнийг тоогоор хийх боломжийг бидэнд олгодог. Эхний таамаглалын өмнөх магадлал (томъёо 7) байсан P(x 1), цагаан бөмбөг зурж, анхны таамаглалын арын магадлал болсон P(x 1|1-д).Эдгээр магадлал нь нэг хүчин зүйлээр ялгаатай.

Үйл явдал 1 цагттаамаглалыг их бага багаар баталж, үгүйсгэдэг нотлох баримт гэж нэрлэдэг x 1. Энэ коэффициентийг заримдаа нотлох чадвар гэж нэрлэдэг. Нотлох баримт нь илүү хүчтэй байх тусам (коэффициент нь нэгдмэл байдлаас илүү их ялгаатай байх тусам) ажиглалтын баримт илүү их байх болно. 1 цагтөмнөх магадлалыг өөрчилнө, арын магадлал өмнөхөөсөө их ялгаатай байна. Хэрэв нотлох баримт сул байвал (коэффицент ~1) арын магадлал өмнөхтэй бараг тэнцүү байна.

Сертификат 1 цагтВ = 2 удаа таамаглалын өмнөх магадлалыг өөрчилсөн x 1(томъёо 4). Үүний зэрэгцээ нотлох баримт 1 цагттаамаглалын магадлалыг өөрчилсөнгүй x 2, түүний хүчнээс хойш = 1 (томъёо 5).

Ерөнхийдөө Bayes томъёо нь дараах хэлбэртэй байна.

X– дараах утгуудыг авсан санамсаргүй хэмжигдэхүүн (бие биенээ үгүйсгэсэн таамаглалын багц): x 1, x 2, … , Xn. цагт– дараах утгуудыг авсан санамсаргүй хэмжигдэхүүн (бие биенээ үгүйсгэсэн үйл явдлын багц): 1 цагт, 2 цагт, … , цагтn. Бэйсийн томъёо нь таамаглалын арын магадлалыг олох боломжийг олгодог Xбиүйл явдал тохиолдсон үед y j. Тоолуур нь таамаглалын өмнөх магадлалын үржвэр юм XбиP(xби) үйл явдал болох магадлалын талаар y j, хэрэв таамаглал үнэн бол XбиP(y j|xби). Хуваарь нь тоологчтой ижил үржвэрүүдийн нийлбэр юм, гэхдээ бүх таамаглалын хувьд. Хэрэв бид хуваагчийг тооцоолвол үйл явдлын нийт магадлалыг авна цагтj(хэрэв таамаглалуудын аль нэг нь үнэн бол) - P(y j) (1-3-р томъёоны дагуу).

Дахин нэг удаа гэрчлэлийн тухай. Үйл явдал y jнэмэлт мэдээлэл өгдөг бөгөөд энэ нь таамаглалын өмнөх магадлалыг хянах боломжийг танд олгоно Xби. Нотлох баримтын хүч - – тохиолдох үйл явдлын магадлалыг тоологчд агуулна y j, хэрэв таамаглал үнэн бол Xби. Хуваарь нь тохиолдох үйл явдлын нийт магадлал юм. цагтj(эсвэл үйл явдал болох магадлал цагтjбүх таамаглалыг дундажласан). цагтjТаамаглалын хувьд дээр xби, бүх таамаглалуудын дунджаас илүү, дараа нь нотлох баримтууд таамаглалын гарт тоглодог xби, түүний арын магадлалыг нэмэгдүүлэх P(y j|xби). Хэрэв ямар нэгэн үйл явдал болох магадлал цагтjтаамаглалыг доороос үзнэ үү xбибүх таамаглалын дунджаас илүү бол нотлох баримт нь арын магадлалыг бууруулдаг P(y j|xби) Учир ньтаамаглал xби. Хэрэв ямар нэгэн үйл явдал болох магадлал цагтjтаамаглалын хувьд xбибүх таамаглалын дундажтай ижил байвал нотлох баримт нь арын магадлалыг өөрчлөхгүй P(y j|xби) Учир ньтаамаглал xби.

Бэйсийн томъёоны талаарх таны ойлголтыг бататгана гэж найдаж буй хэдэн жишээ энд байна.

Даалгавар 2. Хоёр буудагч нэг бай руу бие даан буудаж, тус бүр нэг сумаар буудна. Эхний мэргэн буучийн хувьд бай онох магадлал 0.8, хоёр дахь нь 0.4 байна. Буудсаны дараа зорилтот хэсэгт нэг нүх олдсон. Энэ нүх нь анхны харваачийнх байх магадлалыг ол. .

Даалгавар 3. Хянаж буй объект нь H 1 = (ажиллах) ба H 2 = (ажиллахгүй) гэсэн хоёр төлөвийн аль нэгэнд байж болно. Эдгээр төлөвүүдийн өмнөх магадлал нь P(H 1) = 0.7, P(H 2) = 0.3 байна. Объектийн төлөв байдлын талаар зөрчилтэй мэдээлэл өгдөг мэдээллийн хоёр эх сурвалж байдаг; Эхний эх сурвалж нь объект ажиллахгүй байна гэж мэдээлдэг, хоёрдугаарт - ажиллаж байна. Эхний эх сурвалж нь 0.9 магадлалтай зөв мэдээлэл, 0.1 магадлалаар буруу мэдээлэл өгдөг нь мэдэгдэж байна. Хоёрдахь эх сурвалж нь найдвартай биш: 0.7 магадлалтай зөв мэдээлэл, 0.3 магадлалтай буруу мэдээлэл өгдөг. Таамаглалын арын магадлалыг ол. .

1-3-р асуудлыг Е.С.Вентцел, Л.А.Овчаровын сурах бичгээс авав. Магадлалын онол ба түүний инженерчлэлийн хэрэглээ, хэсэг 2.6 Таамаглалын теорем (Бэйсийн томъёо).

Бодлого 4 Номын 4.3 Бэйсийн теоремоос авсан.

Бэйсийн томъёо

Бэйсийн теорем- ажиглалтын үндсэн дээр үйл явдлын зарим хэсэгчилсэн мэдээлэл л мэдэгдэж байгаа нөхцөлд тохиолдох үйл явдлын магадлалыг тодорхойлдог энгийн магадлалын онолын гол теоремуудын нэг. Байесийн томьёог ашиглан урьд өмнө мэдэгдэж байсан мэдээлэл болон шинэ ажиглалтын өгөгдлийг хоёуланг нь харгалзан магадлалыг илүү нарийвчлалтай дахин тооцоолох боломжтой.

"Физик утга" ба нэр томъёо

Байесийн томьёо нь "шалтгаан ба үр дагаврыг дахин зохицуулах" боломжийг олгодог: үйл явдлын мэдэгдэж буй баримтыг харгалзан, өгөгдсөн шалтгаанаас үүдэлтэй байх магадлалыг тооцоол.

Энэ тохиолдолд "шалтгаан" -ын үйлдлийг тусгасан үйл явдлуудыг ихэвчлэн нэрлэдэг таамаглал, тэд байгаа тул гэж таамаглаж байнаүүнд хүргэсэн үйл явдлууд. Таамаглал үнэн байх нөхцөлгүй магадлалыг гэнэ априори(шалтгаан нь хэр магадлалтай вэ ерөөсөө), мөн нөхцөлт - үйл явдлын баримтыг харгалзан - a posteriori(шалтгаан нь хэр магадлалтай вэ үйл явдлын мэдээллийг харгалзан үзсэн).

Үр дагавар

Байесийн томъёоны чухал үр дагавар нь үйл явдлын нийт магадлалын томъёо юм хэд хэдэнүл нийцэх таамаглал ( зөвхөн тэднээс!).

- үйл явдал болох магадлал Б, хэд хэдэн таамаглалаас хамаарна А би, эдгээр таамаглалын найдвартай байдлын зэрэг нь мэдэгдэж байгаа бол (жишээлбэл, туршилтаар хэмжсэн);

Томъёоны гарал үүсэл

Хэрэв үйл явдал зөвхөн шалтгаанаас шалтгаална А би, дараа нь ийм зүйл тохиолдсон бол шалтгаануудын аль нэг нь тохиолдсон байх ёстой гэсэн үг, i.e.

Бэйсийн томъёоны дагуу

Шилжүүлгээр П(Б) баруун талд бид хүссэн илэрхийлэлийг олж авна.

Спам шүүлтүүрийн арга

Байесийн теорем дээр үндэслэсэн арга нь спам шүүлтэнд амжилттай хэрэглэгдэх болсон.

Тодорхойлолт

Шүүлтүүрийг сургахдаа үсгээр таарсан үг бүрийн хувьд түүний "жин" -ийг тооцоолж, хадгалдаг - энэ үгтэй захидал спам байх магадлал (хамгийн энгийн тохиолдолд - магадлалын сонгодог тодорхойлолтын дагуу: "спам дахь харагдах байдал / нийт харагдах байдал").

Шинээр ирсэн захидлыг шалгахдаа спам байх магадлалыг дээрх томьёог ашиглан янз бүрийн таамаглалаар тооцдог. Энэ тохиолдолд "таамаглал" гэдэг нь үг бөгөөд "таамаглалын найдвартай байдал" гэсэн үг бүрийн хувьд "таамаглалын найдвартай байдал" нь үсэг дээрх энэ үгийн %, "таамаглалаас үйл явдлын хамаарал" гэсэн үг юм. П(Б | А би) - үгийн өмнө нь тооцоолсон "жин". Өөрөөр хэлбэл, энэ тохиолдолд захидлын "жин" нь түүний бүх үгсийн дундаж "жин"-ээс өөр зүйл биш юм.

Захидлыг "жин" нь хэрэглэгчийн тодорхойлсон тодорхой хэмжээнээс (ихэвчлэн 60-80%) хэтэрсэн эсэхээс хамаарч "спам" эсвэл "спам" биш гэж ангилдаг. Захидал дээр шийдвэр гарсны дараа түүнд орсон үгсийн "жин"-ийг мэдээллийн санд шинэчилдэг.

Онцлог шинж чанартай

Энэ арга нь энгийн (алгоритмууд нь энгийн), тохиромжтой ("хар жагсаалт" болон үүнтэй төстэй хиймэл техникгүйгээр хийх боломжийг олгодог), үр дүнтэй (хангалттай том дээж дээр сургасны дараа спамыг 95-97% хасдаг, мөн алдаа гарсан тохиолдолд дахин сургаж болно). Ерөнхийдөө үүнийг өргөнөөр ашиглах бүх заалт байдаг бөгөөд энэ нь практикт тохиолддог зүйл юм - бараг бүх орчин үеийн спам шүүлтүүрүүд нь түүний үндсэн дээр бүтээгдсэн байдаг.

Гэсэн хэдий ч энэ арга нь үндсэн сул талтай: энэ таамаглал дээр үндэслэсэн, Юу Зарим үгс спам дээр илүү түгээмэл байдаг бол зарим нь ердийн имэйлд илүү түгээмэл байдаг, хэрэв энэ таамаглал буруу бол үр дүнгүй болно. Гэсэн хэдий ч практикээс харахад хүн ч гэсэн ийм спамыг "нүдээр" илрүүлж чадахгүй - зөвхөн захидлыг уншиж, утгыг нь ойлгох замаар л илрүүлж чадахгүй.

Хэрэгжүүлэхтэй холбоотой өөр нэг үндсэн бус сул тал бол энэ арга нь зөвхөн тексттэй ажиллах явдал юм. Энэхүү хязгаарлалтыг мэдээд спам илгээгчид зар сурталчилгааны мэдээллийг зурган дээр оруулж эхэлсэн боловч захидал дахь текст дутуу эсвэл утгагүй байв. Үүнийг эсэргүүцэхийн тулд та текстийг таних хэрэгслийг (зөвхөн зайлшгүй шаардлагатай үед ашигладаг "үнэтэй" процедур), эсвэл хуучин шүүлтүүрийн аргууд - "хар жагсаалт" болон ердийн хэллэгийг ашиглах хэрэгтэй (ийм үсэг нь ихэвчлэн хэвшмэл хэлбэртэй байдаг).

Мөн үзнэ үү

Тэмдэглэл

Холбоосууд

Уран зохиол

  • Киви шувуу. Эрхэм хүндэт Бэйсийн теорем. // Computerra сэтгүүл, 2001 оны 8-р сарын 24.
  • Пол Грэм. Спамын төлөвлөгөө (Англи хэл). // Пол Грахамын хувийн вэбсайт.

Викимедиа сан.

2010 он.

    Дараах хэлбэртэй томъёо: a1, A2,..., An нь үл нийцэх үйл явдал, f.v-ийн хэрэглээний ерөнхий схем. ж.: хэрэв В үйл явдал өөр хэлбэрээр тохиолдож болно Туршилтын өмнө мэдэгдэж байсан P(A1), ... магадлал бүхий A1, A2, ..., An n таамаглалыг хийсэн нөхцөл. Геологийн нэвтэрхий толь бичиг

    Тодорхой таамаглалын таамаглалаар энэ үйл явдлын нөхцөлт магадлал, түүнчлэн эдгээр таамаглалуудын магадлалаар дамжуулан сонирхолтой үйл явдлын магадлалыг тооцоолох боломжийг танд олгоно. Томъёо Магадлалын орон зайг өгье, бүтэн бүлгийг хосоор нь... ... Википедиа

    Тодорхой таамаглалын таамаглалаар энэ үйл явдлын нөхцөлт магадлал, түүнчлэн эдгээр таамаглалуудын магадлалаар дамжуулан сонирхолтой үйл явдлын магадлалыг тооцоолох боломжийг танд олгоно. Томъёо Магадлалын орон зайг өгье, үйл явдлын бүрэн бүлэгт ... ... Википедиа

    - (эсвэл Бэйсийн томьёо) магадлалын онолын гол теоремуудын нэг бөгөөд зөвхөн шууд бус нотлох баримт (өгөгдөл) байгаа тохиолдолд ямар нэгэн үйл явдал болсон (таамаглал) магадлалыг тодорхойлох боломжийг олгодог бөгөөд энэ нь буруу байж болох юм... Wikipedia

    Байесийн теорем нь ажиглалтын үндсэн дээр үйл явдлын зарим хэсэгчилсэн мэдээлэл л мэдэгдэж байгаа нөхцөлд тохиолдох үйл явдлын магадлалыг тодорхойлдог элементар магадлалын онолын үндсэн теоремуудын нэг юм. Байесийн томъёог ашиглан та... ... Википедиа

    Бэйс, Томас Томас Бэйс Хүндэтгэлтэн Томас Байес Төрсөн огноо: 1702 (1702) Төрсөн газар ... Википедиа

    Томас Бэйс Хүндэтгэлтэн Томас Байес Төрсөн огноо: 1702 Төрсөн газар: Лондон ... Википедиа

    Байесийн дүгнэлт нь нотлох баримтыг хүлээн авах үед таамаглалын үнэнийг магадлалын тооцооллыг боловсронгуй болгоход Байесийн томъёог ашигладаг статистик дүгнэлтийн аргуудын нэг юм. Bayesian update-ийг ашиглах нь ялангуяа... ... Википедиа-д чухал ач холбогдолтой

    Энэ нийтлэлийг сайжруулах нь зүйтэй болов уу?: Бичсэн зүйлийг баталгаажуулах эрх бүхий эх сурвалжийн зүүлт тайлбарын холбоосыг олж, цэгцлээрэй. Зүүлт тайлбар нэмсний дараа эх сурвалжийн талаар илүү нарийвчлалтай зааж өгнө үү. Пере... Википедиа

    Хоригдлууд хувиа хичээсэн ашиг сонирхлоо дагаж бие биенээсээ урвах уу, эсвэл чимээгүй байж, нийт ялыг багасгах уу? Prisoner's dilemma (Англи хэл: Prisoner's dilemma, бага ашиглагддаг "dilemma ... Wikipedia"

Номууд

  • Бодлого дахь магадлалын онол, математик статистик. 360 гаруй даалгавар, дасгал, Borzykh D.A.. Санал болгож буй гарын авлага нь янз бүрийн түвшний нарийн төвөгтэй даалгавруудыг агуулдаг. Гэсэн хэдий ч гол анхаарал нь дунд зэргийн нарийн төвөгтэй ажлуудад чиглэгддэг. Энэ нь оюутнуудыг...

Нийт магадлалын томьёог гаргахдаа үйл явдал болсон гэж үзсэн А, магадлалыг тодорхойлох шаардлагатай байсан нь үйл явдлын аль нэгэнд тохиолдож болно Н 1 , Н 2 , ... , Н н, хосоороо үл нийцэх үйл явдлуудын бүрэн бүлгийг бүрдүүлэх. Түүгээр ч барахгүй эдгээр үйл явдлын магадлалыг (таамаглал) урьдчилан мэдэж байсан. Туршилт явагдсан бөгөөд үүний үр дүнд үйл явдал болсон гэж үзье Аирлээ. Энэхүү нэмэлт мэдээлэл нь таамаглалын магадлалыг дахин үнэлэх боломжийг бидэнд олгодог. би,тооцоолсны дараа P(H i /A).

эсвэл нийт магадлалын томъёог ашиглан бид олж авна

Энэ томьёог Бэйсийн томъёо буюу таамаглалын теорем гэдэг. Бэйсийн томъёо нь тухайн үйл явдалд хүргэсэн туршилтын үр дүн тодорхой болсны дараа таамаглалын магадлалыг "шинэлэх" боломжийг олгодог. А.

Магадлал Р(Н i)− эдгээр нь таамаглалын априори магадлал юм (тэдгээрийг туршилтын өмнө тооцоолсон). магадлалууд P(H i /A)− эдгээр нь таамаглалын арын магадлал (тэдгээрийг туршилтын дараа тооцдог). Байесийн томъёо нь өмнөх магадлал болон үйл явдлын нөхцөлт магадлалаас хойшхи магадлалыг тооцоолох боломжийг танд олгоно. А.

Жишээ. Бүх эрчүүдийн 5%, эмэгтэйчүүдийн 0.25% нь өнгөт харалган байдаг нь мэдэгдэж байна. Эмнэлгийн картын дугаараар санамсаргүй байдлаар сонгосон хүн өнгөт харалган өвчтэй байдаг. Эрэгтэй байх магадлал хэд вэ?

Шийдэл. Үйл явдал А- хүн өнгөт харалган өвчтэй байдаг. Туршилтын үндсэн үйл явдлын орон зай - хүнийг эмнэлгийн картын дугаараар сонгоно - Ω = ( Н 1 , Н 2 ) 2 үйл явдлаас бүрдэнэ:

Н 1 - эрэгтэй хүн сонгогдсон,

Н 2 - эмэгтэй хүн сонгогдсон.

Эдгээр үйл явдлуудыг таамаглал болгон сонгож болно.

Асуудлын нөхцлийн дагуу (санамсаргүй сонголт) эдгээр үйл явдлын магадлал нь ижил бөгөөд тэнцүү байна П(Н 1 ) = 0.5; П(Н 2 ) = 0.5.

Энэ тохиолдолд хүн өнгөт харалган өвчтэй байх нөхцөлт магадлал нь тэнцүү байна.

R(A/N 1 ) = 0.05 = 1/20; R(A/N 2 ) = 0.0025 = 1/400.

Сонгосон хүн өнгөний сохор, өөрөөр хэлбэл үйл явдал болсон нь мэдэгдэж байгаа тул эхний таамаглалыг дахин үнэлэхийн тулд Bayes-ийн томъёог ашиглана.

Жишээ.Гурван ижил төстэй хайрцаг байна. Эхний хайрцагт 20 цагаан бөмбөг, хоёр дахь хайрцагт 10 цагаан, 10 хар, гурав дахь хайрцагт 20 хар бөмбөг байна. Санамсаргүй байдлаар сонгосон хайрцагнаас цагаан бөмбөг авдаг. Эхний хайрцагнаас бөмбөг сугалах магадлалыг тооцоол.

Шийдэл. -ээр тэмдэглэе Аүйл явдал - цагаан бөмбөгний дүр төрх. Хайрцаг сонгох талаар гурван таамаглал (таамаглал) хийж болно. Н 1 ,Н 2 , Н 3 - эхний, хоёр, гурав дахь хайрцгийг сонгох.

Хайрцагуудын аль нэгийг сонгох нь адилхан боломжтой тул таамаглалын магадлал ижил байна.

П(Н 1 )=P(N 2 )=P(N 3 )= 1/3.

Бодлогын дагуу эхний хайрцагнаас цагаан бөмбөг зурах магадлал байна

Хоёр дахь хайрцагнаас цагаан бөмбөг зурах магадлал



Гурав дахь хайрцагнаас цагаан бөмбөг зурах магадлал

Бид Bayes томъёог ашиглан хүссэн магадлалыг олно.

Туршилтын давталт. Бернуллигийн томъёо.

N туршилтыг явуулж байгаа бөгөөд тэдгээр нь тус бүрт А тохиолдох эсвэл тохиолдохгүй байж болох ба бие даасан туршилт бүрт А үйл явдлын магадлал тогтмол байдаг, өөрөөр хэлбэл. туршлагаас туршлагад өөрчлөгддөггүй. Нэг туршилтаар А үйл явдлын магадлалыг хэрхэн олохыг бид аль хэдийн мэддэг болсон.

n туршилтаар А үйл явдал тодорхой тооны удаа (м удаа) тохиолдох магадлал онцгой анхаарал татаж байна. Туршилтууд бие даасан байвал ийм асуудлыг амархан шийдэж болно.

Def.Хэд хэдэн туршилтыг дууддаг А үйл явдлын хувьд бие даасан , хэрэв тус бүр дэх А үйл явдлын магадлал нь бусад туршилтын үр дүнгээс хамаарахгүй бол.

Эдгээр n туршилтанд А үйл явдал яг m удаа (байхгүй n-m удаа, үйл явдал ) үүсэх магадлал P n (m). А үйл явдал маш өөр дарааллаар m удаа гарч ирдэг).

Бернуллигийн томъёо.

Дараахь томъёонууд тодорхой байна.

Р n (м бага n туршилтанд k удаа.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - А үйл явдал тохиолдох магадлал. илүү n туршилтанд k удаа.1) n = 8, m = 4, p = q = ½,