산업공학/경영과학

포아송 분포를 실생활 속 사례를 바탕으로 알아보자 (+ 지수 분포)

누군가의 이야기 2024. 10. 15. 01:25
728x90

https://youtu.be/0aMlpmkZsck?list=LL

 

정말 유익한 컨텐츠를 많이 다루시는 유튜버 12Math

 

보통 컨텐츠들 이해하며 빠르게 보거나, 정말 유익하다 싶으면 여러 번 보고 말았는데

 

정말 나의 지식으로 체화하고 싶으면 시간 내어 글로 정리하는 방식만큼 효과적인 방법이 또 없다.

(효율적이진 않다. 블로그 포스팅 별 거 아닌 것 같아도 시간 제법 오래 잡아먹음.. )

 

위 영상을 시청하며 공부하듯이 가볍게 내용 정리해본다. 


 

문제 상황:

어느 공휴일, 단골 카페에 온라인으로 커피를 주문하려고 했는데 영업을 안 하더라

아쉬운 마음에 집 밖을 나서 다른 카페를 찾아가던 중, 단골 카페가 영업 중이라는 사실을 알게 된다. (전산 상 오기재)

그래서 사장님께 여쭤보니, "어쩐지 오전에 주문이 하나도 안 오더라. 알려줘서 고맙다"라는 답변이 돌아온다.

 

여기서 궁금한 점:

카페 사장님은 언제까지 전산 상 오기재가 있다는 사실을 몰랐을까?

=> 포아송 분포에 대해 잘 이해하고 있었다면, 조금 더 미리 눈치 챘을 수 있을 것 같은데?

 

이 논리의 흐름이 정말 배우고 싶고, 닮고 싶은 점이었다. 

나름대로 대학 시절 확률에 투자한 시간이 정말 많은데, 생각의 흐름이 이렇게 뻗어나가지 못하는 것이,

평소에 지향하던 공학적 사고 방식을 제대로 활용하지 못해온 것 같아서,

닮고 싶다는 생각을 많이 했다. 각설하고, 

 

문제 상황 풀이:

평균적으로 이 카페의 오전 온라인 주문 건 수가 평균 5건 정도라고 가정했을 때,

(사장님이 데이터를 보지 않아도 운영하면서 어느 정도 감은 있을 것)

우연하게도 오늘 오전 온라인 주문이 0건인 확률은 어느 정도일까?

포아송분포에 따르면 e^(-5) =  0.67% = 150분의 1 확률이라고 추정할 수 있다.

 

불가능한 확률은 아니지만, 1% 미만의 확률이라면 무언가 잘못 됐음을 충분히 의심할만 한 근거로 볼 수 있다.

 

만약 포아송 분포에 대해 몰랐다면,

평소에 평균 5건이고, 어느 날은 2~3건 주문 오는 날도 많으니까, 주문 없을 수도 있지 않나?

혹은, 주문이 아예 없는 날을 막연하게 10% 정도로 예상해볼 수도 있을 것이고

오류까지는 아니라고 생각할 수 있을 것이다.

 

만약 평균 주문 건 수가 10건이라면, 주문이 안 들어올 확률은 0.0045%로 더욱 희박해진다.

20000번 중에 한 번. 즉 54년에 한 번 있을까 말까 한 일이 되는 것이다.

정상적으로 일어날 수 없는 일이라고 받아드리는 것이 타당할 것이다.

 

이렇게 포아송분포를 비롯한 확률론을 잘 이해하고 있다면,

데이터는 우리에게 많은 생각과 인사이트를 줄 수 있다.

포아송 분포를 잘 이해하고 있었다면, 주문 라인의 오류를 조기에 캐치하고 해결하여 매출을 높일 수 있고,

그렇지 못하면 시스템의 문제를 방치하고 고객을 잃을 수도 있다는 것이다. 

 

포아송 분포와 지수 분포

이제 포아송분포가 무엇인지 다시 상기해보자. (지수 분포는 그냥 껴넣음)

 

정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값 λ라고 했을 때, 그 사건이 k회 일어날 확률

 

확률 분포: 확률 변수가 특정한 값을 가질 확률을 나타내는 분포이다.

포아송 분포: 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는이산 확률 분포이다.

단위 시간 대신 다른 단위 (가령, 공장의 생산량 묶음 단위인 로트(lot) 등)를 사용할 수 있다.

이때 일어날 확률은 일정하고, 매우 작아야 한다.

지수 분포: 사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다. -

출처: 위키백과

 

포아송 분포는, 단위 기간 동안 사건의 "발생 횟수"에 대한 분포이고

지수 분포는, 사건이 최초 발생할 때까지의 "대기 시간"에 대한 분포이다. 

 

 

정의된 문제에 따르면,

람다는 평균 주문 건 수(5건). k는 0건. => 대입하면 e^(-5)가 된다.

 

 

다른 예를 들어보면,

 

일정 단위 기간 동안 물류 라인에서 평균적으로 20,000번 정도 검수가 이뤄진다고 할 때

포아송 분포에 따라서 표준 편차는 루트 적용하여 대략 150번 정도 될 수 있다.

그런데 검수한 건이 어느 기간 동안 19,000개로 줄었다면

다른 외부 요인이 작용하여 정상적으로 검수가 이뤄지지 못하고 있는지 의심해볼 수 있을 것이다.

 

단지 5% 줄었다는 것에 초점을 맞출 것이 아니라

확률적으로 물류 라인 중 어느 곳에 병목이 있는 게 아닌지 찾아봐야 할 것이다.

 

포아송 분포를 이해하고 있으면 직관이 생길 수 있는 영역이 있고

실생활 속의 어떤 이벤트가 어떤 분포를 따르는지 이해하고 적용할 수 있다면

일상에서 수학이 주는 생활의 효용을 크게 느낄 수 있을 것이라 생각한다.

 

 

 

 

728x90

'산업공학 > 경영과학' 카테고리의 다른 글

마르코프 체인 (Markov Chains) 이해하기 앞서 필요한 개념  (0) 2022.12.09
이진변수를 활용한 제약 모델링 개선  (0) 2022.10.21
Memoryless property  (0) 2022.04.24
Queueing Model  (0) 2022.04.14
Little's Law  (0) 2022.04.07