Featured Post
5편. 다국어 사이트 기술 체크리스트: hreflang부터 스키마 마크업까지
- 공유 링크 만들기
- X
- 이메일
- 기타 앱
URL 구조를 잡고 언어 선택 UI를 설계했으며 CMS와 번역 도구도 골랐다. 이제 실제로 사이트를 올리기 전에 기술 설정을 점검해야 한다. 이 편은 다국어 사이트에서 반드시 확인해야 할 기술 항목들을 순서대로 정리한다. 하나라도 빠지면 구글이 엉뚱한 페이지를 엉뚱한 나라 독자에게 보여준다.
다국어 웹사이트 구조와 기술 설계
2편. 언어 선택 UI는 설계방법
3편. CMS와 번역 도구 선택 기준
5편. 다국어 사이트 기술 체크리스트 ←현재글
6편. 운영 효율을 높이는 구조 설계 원칙 (예정)
7편. 구축 전 반드시 확인할 테스트 항목 (예정)
체크 1. hreflang 태그 - 가장 중요한 다국어 신호
hreflang은 구글에게 '이 페이지는 어떤 언어의 어떤 지역 독자를 위한 것'이라고 알려주는 태그다. 다국어 사이트에서 가장 핵심적인 기술 설정이다. 국제 사이트 중 75%가 hreflang을 잘못 설정해 검색 순위가 분산된다는 분석도 있다. 반면 올바르게 설정한 사이트는 해당 언어 지역 트래픽이 수개월 내 40%까지 증가했다는 사례도 있다. 그만큼 영향이 크다.
hreflang 설정 3가지 원칙
원칙 하나. 모든 언어 버전이 서로를 참조해야 한다. 한국어 페이지는 영어 페이지를, 영어 페이지는 한국어 페이지를 각각 hreflang으로 가리켜야 한다. 한쪽만 설정하면 구글이 무시한다.
<!-- 한국어 페이지의 <head>에 삽입 -->
<link rel="alternate" hreflang="ko" href="https://example.com/ko/article/" />
<link rel="alternate" hreflang="en" href="https://example.com/en/article/" />
<link rel="alternate" hreflang="x-default" href="https://example.com/en/article/" />
원칙 둘. x-default를 반드시 포함한다. x-default는 어떤 언어에도 해당하지 않는 독자에게 보여줄 기본 페이지를 지정한다. 보통 영어 버전이나 메인 언어 버전을 지정한다.
원칙 셋. hreflang은 페이지 <head>에 넣거나, XML 사이트맵에 넣는다. 페이지가 많다면 사이트맵 방식이 관리하기 훨씬 쉽다. WPML, Yoast SEO, Rank Math 같은 플러그인을 쓰면 자동으로 생성된다.
자주 나오는 실수
hreflang에서 가장 많이 나오는 실수는 언어 코드를 잘못 쓰는 것이다. 한국어는 ko, 영어는 en, 일본어는 ja, 중국어 간체는 zh-CN이다. korean이나 KOR 같은 비표준 코드를 쓰면 구글이 인식하지 못한다.
체크 2. canonical 태그 - 중복 콘텐츠 방지
canonical 태그는 '이 페이지가 원본'이라고 구글에 알리는 태그다. 다국어 사이트에서 특히 중요하다.
핵심 규칙이 하나다. 각 언어 페이지의 canonical은 같은 언어 페이지를 가리켜야 한다. 한국어 페이지가 영어 페이지를 canonical로 가리키면 구글이 한국어 페이지를 중복 콘텐츠로 처리해 색인에서 제외할 수 있다.
<!-- 한국어 페이지: 자기 자신을 canonical로 지정 -->
<link rel="canonical" href="https://example.com/ko/article/" />
<!-- 영어 페이지: 자기 자신을 canonical로 지정 -->
<link rel="canonical" href="https://example.com/en/article/" />
체크 3. XML 사이트맵 - 언어별로 분리하거나 통합 색인 만들기
사이트맵은 구글 크롤러에게 사이트 구조를 알려주는 지도다. 다국어 사이트라면 선택지가 두 가지다.
방법 A. 언어별 사이트맵을 따로 만든다. sitemap-ko.xml, sitemap-en.xml 형태로 분리한다. 언어별 색인 상태를 Google Search Console에서 따로 모니터링할 수 있다.
방법 B. 하나의 사이트맵 색인 파일로 통합한다. sitemap-index.xml에서 언어별 사이트맵을 참조하는 방식이다. 관리가 조금 더 편하다.
어느 방법이든 사이트맵에 hreflang 정보를 포함하는 것이 권장된다. 그리고 robots.txt 파일에 사이트맵 URL을 명시해야 크롤러가 바로 찾아갈 수 있다.
# robots.txt 예시
User-agent: *
Allow: /
Sitemap: <https://example.com/sitemap-ko.xml>
Sitemap: <https://example.com/sitemap-en.xml>
체크 4. robots.txt - 크롤러 차단 실수 주의
robots.txt는 크롤러에게 어떤 페이지를 크롤링하지 말라고 알리는 파일이다. 잘못 설정하면 멀쩡한 기사 페이지가 구글에 색인되지 않는다.
다국어 사이트에서 자주 발생하는 실수가 있다. 특정 언어 디렉터리 전체를 실수로 막는 경우다.
# 잘못된 예 — /en/ 전체를 차단
Disallow: /en/ #
올바른 예 — 관리자 페이지만 차단
Disallow: /wp-admin/
설정 후 Google Search Console의 robots.txt 테스터로 반드시 확인해야 한다. 의도한 대로 작동하는지 검증하는 과정이 필수다.
체크 5. HTML lang 속성 - 브라우저와 스크린 리더를 위한 신호
각 언어 페이지의 <html> 태그에 lang 속성을 추가해야 한다. 구글은 이 태그보다 실제 콘텐츠로 언어를 판단하지만 브라우저와 스크린 리더, AI 검색 엔진은 이 신호를 활용한다.
<!-- 한국어 페이지 -->
<html lang="ko">
<!-- 영어 페이지 -->
<html lang="en">
<!-- 중국어 간체 페이지 -->
<html lang="zh-CN">
GEO(생성형 엔진 최적화) 관점에서도 이 설정이 중요하다. ChatGPT, Perplexity, 구글 AI 오버뷰 같은 AI 검색 엔진은 페이지 언어를 명확히 인식해야 올바른 언어 버전을 인용한다.
체크 6. 스키마 마크업 - GEO에서 핵심이 되는 구조화 데이터
스키마 마크업(Schema Markup)은 검색 엔진과 AI에게 페이지 내용을 구조적으로 설명하는 코드다. 뉴스 기사라면 NewsArticle 스키마를 써야 한다.
다국어 사이트에서 중요한 점이 있다. 각 언어 페이지의 스키마 마크업은 해당 언어로 작성해야 한다. 한국어 기사 페이지의 스키마를 영어로 작성하면 AI 검색 엔진이 혼란을 겪는다.
{
"@context": "<https://schema.org>",
"@type": "NewsArticle",
"headline": "다국어 웹사이트 운영 팁",
"inLanguage": "ko",
"datePublished": "2025-05-12",
"author": {
"@type": "Organization",
"name": "미디어 이름"
}
}
inLanguage 속성은 특히 중요하다. AI 시스템이 페이지 언어를 명확히 파악하는 핵심 신호다.
온라인 신문사라면 NewsArticle 외에 FAQPage도 활용하면 좋다. AI 검색 엔진이 FAQ 형식의 콘텐츠를 직접 인용하는 경우가 늘고 있다.
체크 7. Core Web Vitals - 속도와 안정성
구글은 페이지 경험을 랭킹 요소로 사용한다. 다국어 사이트는 언어가 늘수록 페이지 수가 배로 늘어난다. 관리 포인트도 그만큼 많아진다.
핵심 지표는 세 가지다.
LCP(최대 콘텐츠풀 페인트): 주요 콘텐츠가 화면에 표시되는 시간. 2.5초 이하가 목표다.
INP(다음 페인트까지의 상호작용): 사용자가 클릭했을 때 페이지가 반응하는 속도. 200밀리 초 이하가 기준이다. 2024년에 기존 FID 지표를 대체했다.
CLS(누적 레이아웃 이동): 페이지 로딩 중 요소가 움직이는 정도. 0.1 이하가 목표다.
다국어 번역 플러그인은 자바스크립트를 많이 사용하는 경우가 있다. INP 점수에 영향을 줄 수 있다. 플러그인 설치 후 PageSpeed Insights로 점수 변화를 꼭 확인해야 한다.
체크 8. HTTPS와 보안 설정
모든 언어 버전의 URL이 HTTPS로 서비스되어야 한다. 혼합 콘텐츠(mixed content)가 없어야 한다. 서브디렉터리 구조라면 메인 도메인의 SSL 인증서가 모든 언어 페이지에 적용된다. 서브도메인 방식이라면 각 서브도메인에 SSL을 별도로 적용해야 한다.
체크 9. Google Search Console 설정
언어별로 Search Console에서 모니터링 설정을 해야 한다.
서브디렉터리 구조라면 하나의 속성(example.com)으로 모든 언어를 관리할 수 있다. 서브도메인 구조라면 ko.example.com, en.example.com을 각각 별도 속성으로 등록해야 한다.
언어별 사이트맵도 각각 Search Console에 제출해야 한다. 색인 상태, 크롤링 오류, hreflang 오류를 언어별로 확인하는 것이 가능해진다.
실전 체크리스트 한눈에 보기
출시 전 아래 항목을 순서대로 확인하자.
hreflang 설정
□ 모든 언어 페이지가 서로를 hreflang으로 참조하는가?
□ x-default가 설정되어 있는가?
□ ISO 언어 코드가 올바른가? (ko, en, ja, zh-CN 등)
□ 페이지 <head> 또는 사이트맵에 적용되어 있는가?
canonical 설정
□ 각 언어 페이지가 자기 자신을 canonical로 가리키는가?
□ 영어 페이지를 canonical로 가리키는 다른 언어 페이지가 없는가?
사이트맵과 robots.txt
□ 언어별 사이트맵이 생성되어 있는가?
□ robots.txt에 사이트맵 URL이 명시되어 있는가?
□ 언어 디렉터리가 robots.txt에서 실수로 차단되지 않았는가?
HTML과 스키마
□ 각 페이지의 <html lang=""> 속성이 올바른가?
□ 뉴스 기사에 NewsArticle 스키마가 적용되어 있는가?
□ 스키마의 inLanguage 속성이 해당 언어로 설정되어 있는가?
성능과 보안
□ 모든 언어 버전이 HTTPS로 서비스되는가?
□ LCP 2.5초, INP 200ms, CLS 0.1 기준을 충족하는가?
□ Google Search Console에 언어별 사이트맵이 제출되었는가?
무료 점검 도구 3가지
Google Search Console - hreflang 오류, 색인 상태, 크롤링 문제를 무료로 확인할 수 있다. 다국어 사이트 운영에 필수다.
PageSpeed Insights - Core Web Vitals 점수를 URL별로 확인한다. 언어별 페이지를 각각 입력해 점수 차이를 비교해 보자.
Hreflang Checker (hreflangchecker.com) - URL을 입력하면 hreflang 태그의 오류와 누락을 자동으로 진단해 준다. 설정 후 반드시 이 도구로 검증하자.
정리
기술 설정은 한 번 잘못 잡으면 수개월 치 SEO 작업이 허공으로 사라진다. 특히 hreflang 오류는 검색 결과에서 잘못된 언어 버전을 노출시켜 독자를 이탈시킨다. 출시 전 체크리스트를 꼼꼼히 따라가면 대부분의 실수를 예방할 수 있다.
다음 편에서는 모바일과 글로벌 템플릿 설계 팁을 다룬다. 다국어 환경에서 반응형 디자인을 어떻게 구성해야 하는지, 언어에 따라 달라지는 텍스트 길이와 레이아웃 문제를 어떻게 처리할지 실무 중심으로 살펴볼 예정이다.
다국어 웹사이트 운영 팁 시리즈 6편: 운영 효율을 높이는 구조 설계 원칙 → 다음 글 보기
- 공유 링크 만들기
- X
- 이메일
- 기타 앱

댓글
댓글 쓰기