일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 이미지 필터링
- evaluating object hallucination in large vision-language models
- 논문 리뷰
- Object detection article
- evaluating object hallucination in large vision-language models 논문
- polling-based object probing evaluation
- dinov2: learning robust visual features without supervision 논문
- object detection
- 1차 미분 마스크
- mobilenetv1
- vlm hallucination paper
- dinov2: learning robust visual features without supervision
- evaluating object hallucination in large vision-language models paper
- blip-2
- 딥러닝 엔트로피
- vlm hallucination
- vlm
- 원격 학습 안끊기게
- 기계학습
- 논문 요약
- 객체 검출
- 엔트로피란
- 에지 검출
- clip
- vlm 환각이란
- 딥러닝 목적함수
- dinov2 논문 리뷰
- clip adapter
- dinov2: learning robust visual features without supervision 논문 리뷰
- vlm 환각
- Today
- Total
My Vision, Computer Vision
[딥러닝 공부] 노이즈 제거를 위한 이미지 필터링(평균, 미디언, 가우시안) 본문
이 글은
『정성환, 배종욱, OpenCV-Python으로 배우는 영상 처리 및 응용, 생능출판2020년)』
에서 공부한 내용을 토대로 작성되었다.
https://mvcv.tistory.com/38이 글에서 이어집니다.
필터링
이미지 분석, 보정 혹은 전처리 과정에서 사용하는 이미지 필터링은 노이즈를 제거하여 깔끔한 이미지를 얻기 위해 사용한다.
평균값 필터링, 미디언 필터링, 가우시안 스무딩 필터링 등이 있다.
최대값/최소값 필터링
마스크의 크기가 3*3일 때, 이 영역안에 있는 화소중 가장 크거나 가장 작은 값을 출력값으로 정하는 필터링이다.
최대값 필터링은 최대값만 선택되기 때문에 출력 이미지의 밝기가 증가하고 최소값 필터링은 어두워진다.
평균값 필터링
마스크의 영역에 해당하는 화소값들의 평균을 출력으로 내보내는 방법이다.
화소값들의 평균이기 때문에 블러링의 효과가 나타난다.
블러링 마스크를 적용한 결과와 같은데, 3*3의 마스크일 때 각각의 마스크값이 1/9인 것과 화소값들을 모두 더해서 9로 나눈 것의 결과값은 동일하기 때문이다.
미디언 필터링
중간값 필터링이라고도 하며 마스크 영역 안에 있는 화소값들을 정렬했을 때 가운데에 있는 값을 출력으로 내보낸다.
보통 영상에서의 잡음은 정렬했을 때 최상위나 최하위에 위치할 것이기 때문에 미디언 필터링은 잡음 제거로 사용할 수 있다.
하지만 정렬 연산의 비용이 크기때문에 시간이 오래걸릴 수 있다.
또한 3채널 이미지에서 한 채널에서는 주변 화소들과의 차이가 커서 제거되어도 다른 채널에서는 제거가 되지 않아 오히려 잡음이 더 많아질 수 있다.
동시에 평균값 필터링보다는 강도가 약하지만 블러링 효과도 나타난다.
오른쪽 위에 있는 이미지는 소금-후추 잡음(Salt-pepper noise)을 추가한 것이고 미디언 필터링을 적용했을 때 잡음이 모두 제거된 것을 확인할 수 있다.
가우시안 스무딩 필터링
스무딩은 블러링과 같은 의미이다.
스무딩 처리에 사용되는 대표적인 방법으로 블러링이 있다.
가우시안 필터링은 가우시안 분포를 마스크의 계수로 사용하여 회선을 수행하는 것을 말한다.
축이 2개인 2차원 가우시안 분포는 다음과 같은 함수로 표현된다.
$$N(\mu, \sigma)(x) = \frac{1}{\rho\sqrt{2\pi}}exp(^-\frac{(x-\mu)^2}{2\sigma^2})$$
다음으로 3차원에서 가우시안 분포 함수는 아래와 같다.
$$N(\mu, \sigma)(x,y) = \frac{1}{\sigma_x\sigma_y2\pi}exp[-(\frac{(x-\mu)^2}{2\sigma^2_x}+\frac{(y-\mu)^2}{2\sigma^2_y})] = \frac{1}{2\pi\sigma^2}exp(-\frac{x^2+y^2}{2\sigma^2})$$
표준편차가 클수록 평균은 낮아지고 그래프의 폭이 넓게 퍼지게 된다.
즉 블러링과 비슷한 효과가 적용된다. 반대로 표준편차가 작으면 평균이 커지면서 중심계수의 값이 커지고 주변계수의 값은 작아지기 때문에 흐림의 정도가 약해진다.
위 이미지는 원본 이미지에 커널이 17*5(가로*세로)인 크기의 가우시안 필터링 마스크를 적용한 결과이다.
커널이 가로로 길기때문에, 자동으로 표준편차가 세로보다 가로 방향으로 커지게 된다.
따라서 세로 방향으로 심하게 흐려지는 이미지가 만들어진다.
'공부' 카테고리의 다른 글
[딥러닝 공부] 딥러닝 기초(다층 퍼셉트론 오류 역전파 이론) (1) | 2025.01.02 |
---|---|
[딥러닝 공부] 노이즈 제거를 위한 이미지 필터링(평균, 미디언, 가우시안) (3) | 2025.01.02 |
[딥러닝 공부] 1차, 2차 미분 마스크, 에지 검출 (0) | 2024.12.24 |
[딥러닝 공부] 이미지 샤프닝, 블러링, 1차 미분 마스크 (1) | 2024.12.20 |
[딥러닝 공부] 정보 이론과 엔트로피 (1) | 2024.12.18 |