'분류 전체보기' 카테고리의 글 목록 (10 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (86)

My Vision, Computer Vision

[딥러닝 공부] 1차, 2차 미분 마스크, 에지 검출

이 글은『정성환, 배종욱, OpenCV-Python으로 배우는 영상 처리 및 응용, 생능출판2020년)』에서 공부한 내용을 토대로 작성되었다. https://mvcv.tistory.com/37이 글에서 이어집니다.프리윗(Prewitt) 마스크프리윗 마스크는 로버츠 마스크의 단점을 보완하기 위해 고안되었다. 차분을 1회 계산하는 로버츠 마스크와 달리 프리윗 마스크는 차분이 3번 계산되기 때문에 에지의 강도가 강하며, 수직과 수평 에지를 동등하게 찾는 데 효과적이다.수직 마스크-101-101-101수평 마스크-1-1-1001111 dst1과 dst2에서 수직, 수평 에지가 잘 검출된 것을 확인할 수 있고 두 결과를 합친 최종 출력 Prewitt edge 또한 수직과 수평 에지 모두 잘 검출된 ..

공부 2024. 12. 24. 15:37

[딥러닝 공부] 이미지 샤프닝, 블러링, 1차 미분 마스크

이 글은『정성환, 배종욱, OpenCV-Python으로 배우는 영상 처리 및 응용, 생능출판2020년)』에서 공부한 내용을 토대로 작성되었다.회선(Convolution)마스크의 크기가 3 * 3이고 입력 이미지와 출력 이미지의 크기가 같다고 하자. 이 때 한 픽셀에서 컨볼루션 연산을 수행하면 그 픽셀의 주변 8픽셀까지 출력 픽셀에 관여하게 된다. 마스크의 값을 잘 조절하면 블러링, 샤프닝 등과 같이 원하는 특징을 부각시켜 출력 이미지를 만들 수 있게 된다. 블러링# 이미지 파일 경로image_path = "~~/~~/001.jpg"image = cv2.imread(image_path)image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 가우시안 블러링(커널 크기, ..

공부 2024. 12. 20. 15:34

[딥러닝 공부] 정보 이론과 엔트로피

이 글은『크리스토퍼 비숍, 패턴 인식과 머신 러닝, 김형진 옮김, 제이펍(2018년)』에서 공부한 내용을 토대로 작성되었다.정보 이론(Information Theory)정보 이론이란 정보를 수학적으로 정의하고 측정하는 방법을 연구하는 학문이다. 머신 러닝은 데이터 정보를 다루기 때문에 정보 이론의 개념이 중요하다. (실제로 loss 함수에서 엔트로피 개념이 쓰임) 정보량(Information Content)이산 확률 변수 $x$가 있다고 하자. 이 때, 이 $x$가 가지고 있는 정보량이라는게 있다. 정보량은 ‘놀라움의 정도’라고도 하는데, 일어날 가능성이 낮은 사건이 발생했을 때의 정보량이 더 크기(더 놀랍기) 때문이다. 즉 정보량은 $x$가 발생할 확률에 반비례하며 따라서 확률 분포 $p(x)$에 종속..

공부 2024. 12. 18. 21:23

[졸업 논문/프로젝트] 딥러닝 알고리즘을 이용한 상황 검색 가능한 비디오 플레이어 구현

Youtube 영상 장면 검색(Colab)https://github.com/gyuilLim/youtube-scene-search-with-text GitHub - gyuilLim/youtube-scene-search-with-text: Finding scenes that you want by text automaticallyFinding scenes that you want by text automatically - gyuilLim/youtube-scene-search-with-textgithub.com 장면 검색 비디오 플레이어https://github.com/gyuilLim/Scene-search-video-player GitHub - gyuilLim/Scene-search-video-player: ..

WorkPlace 2024. 12. 4. 20:13

[논문 리뷰/요약] VGA: Vision GUI Assistant - Minimizing Hallucinations through Image-Centric Fine-Tuning

VGA: Vision GUI Assistant -- Minimizing Hallucinations through Image-Centric Fine-TuningRecent advances in Large Vision-Language Models (LVLMs) have significantly improve performance in image comprehension tasks, such as formatted charts and rich-content images. Yet, Graphical User Interface (GUI) pose a greater challenge due to their structuarxiv.orgAbstract기존 VLM은 시각적 입력을 무시하고 텍스트에 과도하게 의존하는 경..

Paper 2024. 11. 21. 14:12

[논문 리뷰/요약] REDQT: a method for automatedmobile application GUI testing basedon deep reinforcement learning algorithms

REDQT: a method for automated mobile application GUI testing based on deep reinforcement learning algorithmsAs mobile applications become increasingly prevalent in daily life, the demand for their functionality and reliability continues to grow. Traditional mobile application testing methods, particularly graphical user interface (GUI) testing, face …www.springerprofessional.deAbstract이 논문은 심층 강..

Paper 2024. 10. 16. 11:31

이전 Prev 1 ··· 7 8 9 10 11 12 13 ··· 15 Next 다음

목록분류 전체보기 (86)

My Vision, Computer Vision

티스토리툴바