“구글 추격 따돌리자”…네이버 검색 지금보다 똑똑해진다라는 네이버의 의도검색과 관련한 기사가 지난 5월 13일 매일경제에 올라왔습니다. 기사 내용의 출처는 아마도 네이버일 것으로 예상됩니다. 해당 기사의 주요 꼭지중 한자락을 보면
네이버는 사용자의 검색 의도를 기준으로 콘텐츠를 분류하고 이를 블록처럼 묶는 방식으로 검색 결과를 보여줄 계획이다. 사용자 의도를 바탕으로 문서를 분류하는 딥러닝 기술을 개발하고 있다. 콘텐츠를 ‘주제’와 이 주제를 전달하는 방식인 ‘장르’의 두 축을 중심으로 분류하는 게 핵심이다.
기사의 내용으로 볼 때 시범적으로 약 40여개의 키워드에 대해서는 기존 검색 결과에 나오는 광고 및 기타 상품 중심의 쇼핑, 뷰(VIEW), 뉴스, 지식iN 등 카테고리별로 나열에서 약간의 변화를 주는 것으로 예상됩니다.
의도 검색 (intent research)이라는 꽤나 의미 범위가 넓은 단어를 선택한 부분이 눈에 들어옵니다. 기사에서는 research라고 했지만 저 단어가 나온 이유는 네이버의 2021 NAVER Search Colloquium Global Re:Search에서 나온 것이라 기사 작성된 것으로 예상됩니다. 단어 몇개를 통해서 사용자의 검색 의도를 분류해 검색결과를 달리 나타내겠다는 것으로 예상은 됩니다. 네이버 소속의 김진홍님께서 발표한 Classifying Web Documents By User Intent의 내용이 가장 유사한 발표입니다. 발표 요약은 아래와 같습니다.
검색 사용자가 의도하는 콘텐츠를 잘 찾아 주기 위해서, 네이버가 연구중인 ‘사용자 의도 별 문서 분류 기술’에 대해 소개합니다. 우리는 사용자 의도를 잘 구조화하기 위해, 문서가 다루는 내용을 가리키는 ‘주제(topic)’과, 콘텐츠를 전달하는 방식을 뜻하는 장르(genre)의 두가지 축에 따라 문서를 나누는 분류기를 만들었습니다. 우리는 BERT 및 메타데이터 네트워크 임베딩 기술을 활용하여 계층적 주제체계를 만들고 그에 따라 문서를 분류하는 방법과, 질의에서 사용자 의도에 맞는 장르를 찾아냈던 방법에 대해 설명합니다.
네이버 검색의 개선은 여러가지 기능 개선과 인공지능의 적용 등등 내부적으로 많은 고민과 노력의 결과이겠지만 쇼핑가격비교서비스에서 벗어나지 못하면 저 기사의 점유율에는 크게 변화가 없거나 더 격차가 좁아질 뿐일 겁니다. 아직도 내부 DB인 쇼핑, 뉴스, 지식인, 카페, 블로그 검색에서 벗어나지 못하고 있는 네이버가 컨셉만 추가하는 것이 아닌가 하는 불편함이 있습니다.
기본적으로 크롤링과 인덱싱 성능의 향상도 꼭 필요하겠죠. 아직 이 사이트 seoguide.kr의 2021년 2월 sitemap 제출 이후 네이버의 인덱싱 페이지는 총 1개입니다.
예전 네이트가 아직은 검색엔진에 미련을 가지고 있을 시절, 이미 10여년 전 네이버와 함께 ‘의미 검색’ (Semantic Search)이라는 단어를 꺼낸 것처럼 ‘의도 검색’ 이라는 굉장히 트렌디한 단어를 적당한 시기에 잘 꺼내기는 했습니다.
하지만 거의 대부분의 IT 커뮤니티의 반응은 별로 호의적이지 않습니다. 대부분의 사용자가 네이버의 검색 기능 변화에는 별다른 기대는 하지 않는 것이 현실이기도 합니다. 네이버가 기술에 의해 사용자의 의도를 파악하는 일종의 AI를 적용했다고 하면서도 사람이 분류한 초기 적용 키워드 40여개로 한정한다는 것도 꽤나 유쾌한 농담입니다. 뭔가 아이러니 한 부분이죠. 그래도 반영된 후 추가로 내용은 확인해 보도록 하겠습니다. 그저 검색 결과 나오는 순서와 레이아웃만 바뀌는게 아니길 빌 뿐입니다.
2021년 5월 21일 내용 추가
네이버는 5월 20일 공식적으로 BERT 알고리즘의 적용을 통해 사용자의 검색 의도 파악으로 검색 리스트 랭킹을 개선한다고 발표하였습니다.