화면 분석에 특화된 AI 모델, OmniParser

마이크로소프트에서 개발 중인 화면을 분석하는 AI입니다.
스크린샷을 이용하여 각 화면의 아이콘이나 텍스트, 상호작용 영역 등을 인식하는 것이 주된 특징입니다.

다른 AI를 결합하여 명령을 내리면 AI가 화면을 조작하여 검색 등의 행동을 원활하게 취할 수 있다고 합니다.

프로젝트 페이지

깃허브

2개의 좋아요