[산업과 기술] 중국이 자동운전 분야에서 앞서 나가는 이유 : 월간조선

산업과 기술

중국이 자동운전 분야에서 앞서 나가는 이유

‘무리 전략’으로 자동차 AI혁명 선도

글 : 박정규 KAIST 기술경영전문대학원 겸직교수

URL이 성공적으로 복사되었습니다.

⊙ 한 기업이 앞서 나가면 곧바로 수십 개 기업이 유사한 기술을 모방하며 따라붙어
⊙ 과거 한국 전자 회사들도 ‘무리 전략’으로 성장
⊙ 토요타, 화웨이·샤오미·모멘타 등 중국 업체들과 손잡고 자동운전 분야 진출
⊙ 중국 전기차 메이커 니오(NIO), 더 긴 시간의 맥락을 기억하고 미래 상황 시뮬레이션하는 월드 모델(NWM) 개발
⊙ 중국 모멘타, 토요타·닛산·혼다·메르세데스-벤츠·BMW 등에 자동운전 솔루션 제공

朴正圭
1968년생. 한양대 기계공학과 졸업, 한국과학기술원 기계공학과 석사, 일본 교토대 정밀공학과 박사, 미시간대학 방문학자 / 기아자동차 중앙기술연구소 연구원, 日 교토대 정밀공학과 조교수, LG전자 생산기술원, 현대자동차 자동차산업연구소·해외공장지원실 근무, 한양대 미래자동차공학과 겸임교수 역임. 現 KAIST 기술경영전문대학원 겸직교수 / 번역서 《반도체초진화론》《실천 모듈러 설계》《모노즈쿠리》

: 자율주행차 도로로 지정된 상하이시 안팅의 바오위안루를 달리는 중국 자율주행차들. 사진=상하이시

우리는 그동안 자동차 산업의 대전환을 두 가지 측면에서 이해해 왔다.

첫째는 내연(內燃)기관에서 전기차(電氣車)로의 전환이었다. 각국 정부는 앞다투어 내연기관 퇴출 시한을 못 박고, 배터리 공장 건설 계획을 발표했다. 많은 사람들은 이것이 자동차 산업 변화의 본질이라고 믿었다. 그러나 현실은 더 복잡하다. 중국에서는 전기차와 PHEV(플러그 인 하이브리드)가 급성장하는 반면, 미국과 한국에서는 하이브리드가 다시 주목받고 있다.

둘째는 하드웨어에서 소프트웨어로의 전환이다. 기존 자동차가 경주마처럼 ‘잘 달리기’ 위한 기계적 성능에 집중했다면 오늘날 자동차는 SDV(Software Defined Vehicle)라는 개념 아래 고성능 반도체 칩과 운영체제(OS)를 탑재해 각종 소프트웨어로 제어된다. 마치 근육질 운동선수에게 두뇌를 이식한 것과 같다.

지금은 제3의 변화, 곧 인공지능(AI)의 파고가 밀려오고 있다. 자동차에서 인공지능은 마치 숙련된 운전자의 직관과 판단력을 차 속에 녹여 넣는 것과 같다. 최근 중국 자동차 산업을 관찰하면서 느낀 것은, 이 인공지능의 속도는 우리가 생각하는 이상이다.

AI, 기계공학의 환원주의 전복

필자는 기계공학을 전공했다. 시스템을 이루는 각 구성 요소의 지배방정식(governing equation)을 도출해 연결 관계를 파악하여 산출한 방정식을 시뮬레이션과 실제 실험 결과를 비교하는 것이 기계공학의 정석이다. 결과가 일치하지 않으면 방정식을 다시 검토하거나 실험 과정을 재확인하면서 시스템을 파악해 나간다.

이런 접근이 가능한 이유는 복잡한 시스템도 결국 단순한 요소들의 조합으로 보기 때문이다. 즉 ‘복잡한 시스템을 구성 요소로 분해하고, 각 부품의 기능을 이해하면 전체를 파악할 수 있다’고 본다. 시계를 예로 들어보자. 시계를 완전히 이해하려면 진자(振子)와 같은 부품을 분해해서 구조와 기능을 파악한 뒤 다시 조립해 본다. 숙련된 시계공이라면 이 과정을 통해 시계의 작동 원리를 명확히 설명할 수 있다. 이런 환원주의(還元主義·reductionism) 사고방식이 근대 과학의 토대다. 공학 분야에서는 기계공학이 환원주의와 닿아 있다.

그런데 인공지능은 이런 환원주의와 거리가 멀다. 인공지능은 어떤 문제를 해결하고자 할 경우, 신경망 구조(neural network)를 설계하고, 수많은 데이터를 집어넣어 학습시킨다. 만약 이렇게 해서 나온 결과가 만족스럽지 않으면 데이터 수(數)를 증가시키거나 신경망 구조를 바꿔 다시 학습시킨다. 문제는 그런 결과가 왜 나왔는지를 명확히 설명하기 어렵다는 점이다. 원인과 결과의 명확한 인과(因果)관계를 중시하는 사람에게 이런 접근법은 받아들이기 쉽지 않다.

자동운전 스타트업 CEO의 고백

필자가 인공지능을 좀 더 진지하게 받아들이게 된 것은 올해 5월 일본 자동운전 스타트업 튜링(Turing)의 CEO 야마모토 잇세이(山本一成)와 가진 만남이 계기다. 야마모토는 도쿄대 재학 시절 성적 부진으로 유급을 경험했다. 그는 오히려 이 시간을 기회로 삼아 소프트웨어와 인공지능에 관심을 갖게 되었다. 당시 키보드를 겨우 칠 수 있는 수준이었지만, 일본 장기(將棋) 아마추어 5단의 실력을 가진 그는 장기 프로그램 개발에 도전했다. 처음에는 ‘내가 장기를 잘 두니, 프로그램도 잘 만들 수 있을 거야’라고 생각했다. 그러나 현실은 달랐다. 직접 만든 초기 프로그램은 기대만큼 강하지 않았다. 이후 그는 장기 프로그램에 인공지능 알고리즘을 도입했고, 어느 순간부터 프로그램의 장기 실력이 급격히 향상되었다.

결국 그의 프로그램 ‘포난자(Ponanza)’는 2017년 일본 장기 명인을 꺾었다. 하지만 정작 야마모토 자신은 왜 이렇게 강해졌는지 100% 설명할 수 없었다고 털어놨다.

현재 그는 장기에서 배운 경험을 살려 차량의 자동운전에 도전하고 있다. 카네기멜론대에서 자동운전을 연구했던 아오키 슌스케(青木俊介)와 함께 2021년 튜링이라는 회사를 공동 창업했다.

야마모토가 겪은 시행착오는 자동운전 업계가 걸어온 길과 닮았다. 그가 처음에 ‘내가 장기를 잘 두니, 규칙을 코딩하면 강한 프로그램을 만들 수 있을 것’이라고 생각했듯이, 자동운전 업계도 처음에는 ‘숙련된 운전자의 행동을 규칙으로 만들면 자동운전이 가능할 것’이라고 믿었다. 실제로 2010년대 초반, 구글의 웨이모(Waymo)는 먼저 고정밀 지도를 만들고, 숙련된 운전자의 행동을 규칙으로 옮겨 자동운전을 구현하려 했다. 중국 기업도 마찬가지였다. 당시로서는 가장 현실적인 선택이었다.

하지만 고속도로와 같은 단순한 길에서는 가능했지만, 복잡한 도심에서는 한계가 드러났다. 도시는 공사로 하루아침에 차선이 바뀌고, 임시 신호등이 세워지며, 오토바이 등이 예측 불가능하게 움직인다. 지도를 업데이트하는 속도가 현실 변화를 따라가지 못했다. 그리고 도시 전체의 고정밀 지도를 제작하고 유지하는 데 막대한 비용이 들었다. 가격 경쟁이 치열한 자동차 시장에서 이런 지출은 약점으로 작용했다.

테슬라의 선택

한편 테슬라는 처음부터 달랐다. 다른 회사들이 라이다(LiDAR), 레이더(radar) 등 다양한 센서를 사용하는 동안, 테슬라는 카메라와 인공지능만으로 모든 것을 해결하려 했다. 고정밀 지도나 도로 인프라의 도움도 거부했다. 중국에서는 이런 방식을 ‘단차지능(單車智能·Single-Vehicle Intelligence)’이라 부른다. 지금부터 테슬라를 중심으로 자동운전의 진화를 살펴보자.

자동운전 기술은 카메라 영상으로 물체를 감지하는 것이 출발점이다. 인공지능의 이미지 인식 기술로 차량, 보행자와 같은 대상을 찾아 사각형으로 표시하고, ‘이 물체는 자동차일 확률이 90%’라고 알려주는 방식이었다. 여기다 차선과 주행 가능한 영역을 마치 색칠하듯 구분한다. 세그멘테이션(segmentation)이라 부르는 이 방식은 ‘무엇이 보이는가’를 빠르게 판단하는 데 유리하다.

하지만 실제 세계는 3차원인데, 카메라 영상은 본질적으로 2차원이기에 물체까지의 정확한 거리는 알 수 없다. 이 약점을 보완하기 위해 라이다가 주목받았다. 라이다는 레이저를 무수히 발사하여 물체의 특정 점(point)까지의 거리를 측정하는 센서다. 카메라가 색과 형태를 보는 ‘눈’이라면, 라이다는 실제 거리를 재는 ‘줄자’와 비슷하다. 자동운전을 위해 많은 자동차 회사가 이 방식으로 3차원 공간을 측정하고자 했다.

하지만 다른 자동차 회사와 달리 테슬라는 2차원 인식의 한계를 넘어서기 위해 새로운 방식을 꺼내 들었다. 2021년 테슬라는 AI데이에서 BEV(Bird’s Eye View)라는 기술을 공개했다. 차량 주변에 설치된 8개의 카메라 영상을 하나의 조감도(鳥瞰圖)로 통합하는 기술이었다. 사람이 두 눈의 영상을 하나로 합쳐 세상을 보듯, 8개 카메라의 시야를 하나로 통합하고, 마치 차량 위 30m 상공에서 드론이 내려다보는 것처럼, 360도 전방위를 한눈에 파악할 수 있게 한 것이다.

이 기술의 핵심은 인공지능으로 테슬라는 원래 언어모델에 사용되던 트랜스포머(Transformer)라는 신경망을 시각 정보 처리에 적용, 카메라만으로도 도로 전체를 입체적으로 인식할 수 있음을 보여주었다. BEV는 빠르게 업계 표준이 되었지만 여전히 입체감을 만들어주지는 못하고 있다.([그림] 좌측 BEV 방식)

[그림] 테슬라의 BEV와 점유 네트워크 방식 비교. 출처=2022년 CVPR학회 테슬라 발표 자료

데이터로 인공 신경망 학습시켜

테슬라는 라이다 없이 3차원 공간을 이해하려 노력했다. 여러 각도에서 찍은 화면을 조합해 물체를 추정하는 전통적인 방법(다중 시점 스테레오)이 있었지만, 오차(誤差)가 크고 카메라에 담기는 부분만 알 수 있다는 한계가 있었다.

이에 테슬라는 점유 네트워크(occupancy network)라는 인공지능 기술을 활용했다. 수많은 개와 고양이 사진을 심층 학습(deep learning)으로 구분(이진 분류)하는 것처럼, 공간상의 특정 지점이 물체의 내부인지 바깥인지 판별하여 물체의 윤곽을 파악하는 방법이다.

테슬라는 그동안 수집한 방대한 영상 자료를 가지고 사람이 직접 3차원 공간을 모델링해 학습용 데이터를 만들었고, 이 데이터로 인공 신경망을 학습시켰다. 신경망은 ‘공간상의 임의의 점이 물체 내부인가, 외부인가’라는 단순한 질문에 답하는 훈련을 반복하면서, 점차 3차원 형상을 이해하기 시작했다.

이렇게 학습된 신경망은 부분적으로 가려진 물체도 전체 형상을 추론할 수 있게 됐다. 예를 들어 이동하는 버스가 어떤 장애물로 인해 뒷부분만 보이고 앞부분이 보이지 않아도 사람처럼 신경망은 버스의 대략적인 크기와 형태를 짐작할 수 있게 되었다. ([그림] 우측 점유 네트워크 방식) 테슬라는 이 기술을 2022년 ‘AI데이’에서 공개했다.

모방 학습으로 ‘롱테일 문제’ 극복

2018년 5월 미국 캘리포니아주에서는 테슬라 ‘모델S’ 차량(왼쪽)이 주차돼 있던 경찰차를 들이받는 사고가 발생했다. 사진=AP/연합뉴스

자동운전 시스템은 전통적으로 인지(주변 상황 파악), 예측(다른 차량의 움직임 예상), 계획(주행 경로 결정), 제어(핸들과 페달 조작)라는 네 단계를 활용해 작동한다. 앞서 설명한 조감도와 점유 네트워크는 ‘인지’ 단계에 인공지능을 적용한 것이다. 하지만 ‘어떤 경로로 갈까’ ‘언제 브레이크를 밟을까’ 같은 결정은 여전히 엔지니어가 만든 규칙에 의존했다.

이런 규칙 기반 접근법의 한계는 명확했다. 실제 도로상에서는 ‘공사장 표시’ ‘쓰러진 나무’ 등 예상치 못한 상황이 끊임없이 나타난다. 규칙을 아무리 추가해도 현실의 복잡함을 따라잡을 수 없었다. 자동운전 업계는 이를 ‘롱테일(Longtail) 문제’라 부른다. 전체의 90%를 차지하는 일상적인 상황에, 나머지 10% 예외 상황(edge case)이 붙어 끝없이 반복되는 것을 말한다.

이것만이 아니었다. 더 심각한 문제는 인지-예측-계획-제어라는 각 단계(모듈)를 거치면서 처음의 풍부했던 정보가 점점 단순해지고 왜곡된다는 점이었다.

물론 숙련된 운전자는 처음 겪는 상황에서도 적절히 대응한다. 명시적인 규칙보다는 경험을 통한 학습이 우선하기 때문이다. 2022년 12월, 테슬라의 엔지니어 다발 슈로프(Dhaval Shroff)는 일론 머스크에게 “규칙으로 차량 경로를 정하지 말고, 사람의 운전 경험으로 인공 신경망을 학습시켜 스스로 운전 경로를 찾게 합시다. 자동차용 ChatGPT를 만듭시다”라고 제안했고, 일론 머스크는 이를 수용한다. 이렇게 만들어진 것이 종단 간 학습(End-to-End Learning), 줄여서 E2E라 부르는 방식이다.

이 기술의 핵심은 모방 학습(imitation learning)이다. 인공지능이 수백만 운전자의 실제 주행을 관찰하고 모방하며 운전법을 익힌다. 30만 줄의 프로그램 코드를 지우고, 신경망이 그 자리를 차지했다. 실제 핸들과 페달 조작은 여전히 검증된 제어 알고리즘이 담당하지만, 그 이전까지의 복잡한 의사결정은 모두 인공지능이 수행한다. 이렇게 테슬라는 카메라 영상을 입력받아 곧바로 주행 계획을 출력하는 인공지능망을 구현해 냈다.

E2E의 한계

이토록 효율적인 E2E에도 극복해야 할 문제들이 있었다. 그중 하나는 ‘위지위그(WYSIWYG)’ 방식이라는 점이다. 이것은 워드프로세서에서 나온 용어로 모니터에서 ‘보이는 그대로’라는 의미인 What You See Is What You Get의 약자다.

워드프로세서로 따지면 화면에 보이는 것 그대로 출력되어 좋지만, 자동운전의 경우 도로에서 차량들이 다이내믹하게 움직여 이것만으로는 부족하다. 가령 사람의 경우 앞차가 차선을 이탈하면 ‘졸음운전일지도 모른다’고 추측하며 속도를 줄이거나 추월한다. 또 갑자기 내가 달리는 차선이 막히기 시작하면 ‘앞에서 사고가 난 것 같다’ 판단하고 차선을 바꾼다. 즉 E2E 방식이 해결해야 할 과제 중 하나는 현재 보이는 것만 가지고 판단하는 수준을 넘어 미래를 예측하고 시뮬레이션할 수 있어야 한다.

또한 E2E는 인공지능이 갖고 있는 약점을 그대로 가지고 있다. 즉 왜 이런 결과가 나왔는지 설명하지 못한다는 점이다. 가령 E2E 방식으로 자동운전하는 차량이 갑자기 속도를 줄이거나 차선을 변경한 경우 그 정확한 이유를 알 수가 없다. 그저 수많은 데이터를 보고 학습한 신경망이 현재 상황을 두고 ‘차선 변경’이라는 결론을 내렸을 뿐이다. 이 같은 문제는 이유 없는 사고를 유발할 수도 있어 기존 완성차 회사 입장에서는 수용하기 어려운 기술이다.

현재 자동운전 업계는 이 두 가지 문제를 해결하기 위해 다분히 노력 중이다. 여기에 흥미로운 점이 있는데, 중국 기업들이 테슬라가 개척한 E2E 방식을 기반으로 하되 다양한 변형을 시도하며 기술을 진화시키고 있다는 점이다. 이제부터 중국 기업들이 자동운전 분야에서 어떤 경쟁을 펼치고 있는지 살펴보자.

니오 월드 모델

니오의 월드 모델(시뮬레이션 영상). 0.1초마다 216가지 시나리어를 시뮬레이션한다. 출처=2024년 7월 니오 발표 자료

먼저 중국 자동운전 업계는 2023년 상하이인공지능연구소와 공동 연구하여 〈UniAD〉라는 논문을 발표했다. UniAD는 이전까지는 따로 작동하던 인지·예측·계획을 하나의 네트워크로 통합, 각 단계가 최종 주행 계획이라는 공통 목표를 향해 최적화되도록 설계한 E2E 모델이다. 이 논문은 2023년 CVPR(컴퓨터 비전 및 패턴 인식)에서 최우수 논문상을 받으며 주목받았다. 중국 기업들은 이를 계기로 자동운전에 인공지능 방식을 본격 도입했고, E2E 방식에 머무르지 않고, 한계를 보완하는 고도화에 총력을 기울이고 있다.

그 대표적 중국 전기차 메이커가 니오(NIO)다. 니오는 월드 모델(NWM·NIO World Model)이라는 자동운전 방식을 제시했다. 월드 모델은 E2E 기술을 확장하는 개념으로, 기존 E2E가 수초간의 짧은 영상 클립만 보고 즉각 반응한다면, 월드 모델은 더 긴 시간의 맥락을 기억하고, 물리 법칙을 고려해 미래 상황을 시뮬레이션한다. 예를 들어 E2E는 ‘지금 앞차가 비틀거린다’는 사실만 보고 대응한다. 하지만 월드 모델은 ‘앞차가 수분간 비틀거리는 방식으로 운전해 왔기에 위험하다’고 판단한다.

그리고 니오의 월드 모델은 0.1초마다 216가지 시나리오를 각각 최대 120초 후까지 시뮬레이션하여 최적 경로를 선택하며 그 경로로 운전한다. 즉 과거-현재-미래를 통합적으로 고려해 더 안정적이고 선제적인 주행 결정을 내린다. 앞쪽 시뮬레이션 영상들은 니오의 월드 모델 작동 화면이다. 중앙은 실제 주행 영상이고 주변은 니오의 월드 모델이 예측한 시뮬레이션 영상들이다.

중국의 자동운전 업체들

월드 모델이 미래 예측 능력을 강화했다면, VLA(Vision-Language-Action)는 설명 불가능 문제를 해결하려는 시도다. VLA는 보고(Vision), 언어로 이해하고(Language), 행동한다(Action)는 의미다. 기존 E2E가 영상을 입력받아 곧바로 운전 명령을 출력했다면, VLA는 중간에 언어로 사고(思考)하는 과정을 거쳐 그 이유를 설명할 수 있다.

중국의 리샹(理想汽車·Li Auto)이 2025년 8월에 발표한 MindVLA가 대표적이다. 이 시스템은 AI가 자신의 행동을 실시간으로 설명한다. ‘보행자가 있어 속도를 줄입니다’ ‘앞차가 멈춰서 정차합니다’처럼 판단 근거를 밝힌다.

리샹이 2025년 8월 출시한 순수 전기차 i8의 시연(試演) 영상은 인상적이었다. 자사 연구소의 제한된 환경(시속 30km)이었지만, 운전자가 없는 상태에서 탑승자의 음성 명령만으로 차량이 움직였다. “출발해” “주차해” “속도 올려”와 같이 자연어 명령을 이해하고 실행했다. VLA는 소통하는 투명한 시스템을 지향한다. 탑승자가 AI의 판단을 이해하고 신뢰할 수 있도록 만드는 것이 목표다.

지금 중국 자동운전 기업은 세 진영으로 나뉜다.

첫째, 자동운전 전문 기업으로 ‘모멘타(Momenta)’ ‘DeepRoute.ai’ ‘지평선(Horizon Robotics)’ 등이 있다. 모멘타는 토요타와 닛산 등에 솔루션을 제공해 자동운전 분야에서 2024년 4분기 점유율 48.5%로 1위를, DeepRoute.ai는 15.3%로 3위를 기록했다.

둘째, 화웨이 협력 진영이다. 화웨이는 아이토(AITO), 아바타(Avatr)에 자동운전 솔루션과 컴퓨팅 플랫폼을 패키지로 제공하며 점유율 31.3%로 2위다.

셋째, 완성차 독자 개발 진영으로 니오, 리샹, 샤오펑(Xpeng)이 자체 기술로 차별화를 추구하고 있다. 니오는 월드 모델, 리샹은 VLA를 개발했다.

차오쉬둥의 모멘타

지난 4월 23일 차오쉬둥 모멘타 CEO(오른쪽)는 이가라시 마사유키 혼다 중국 운영책임자와 만나 양사 간 전략적 파트너십을 발표했다. 사진=모멘타 홈페이지

여기서 중국 자동운전 솔루션 분야 1위인 모멘타에 대해 조금 더 살펴보자.

이 회사 창업자 차오쉬둥(曹旭東)은 흥미로운 인물이다. 그는 칭화대에서 공업역학(Engineering Mechanics)을 전공했다. 기계공학 중에서 역학(力學)을 이론적·수학적으로 다루는 학문이다. 졸업 후 차오쉬둥은 박사 과정에 진학하여, 인간의 뇌가 어떻게 작동하는지 연구하고 싶었다.

하지만 생물지능 연구의 검증 주기가 너무 길다는 현실적 문제에 부딪히면서 직접 뭔가 만들어가면서 배울 수 있는 인공지능으로 방향을 전환했다. 그는 스스로 컴퓨터 과학 수업을 찾아 듣고, 논문을 읽으면서 미칠 정도로 빠져들었다고 한다. 그리고 지도교수의 만류에도 박사 과정을 그만두었다. 그는 마이크로소프트 아시아연구소에서 5년, 비전 인식으로 유명한 센스타임에서 1년 5개월간 연구한 뒤, 2016년 30세에 모멘타를 창업했다. 현재 그는 인공지능이 구현하는 자동운전 솔루션을 만들어가고 있다.

모멘타는 ‘완전히 데이터로 구동되는 알고리즘’을 추구하는 방식으로 테슬라와 유사하다. 그는 이 방식을 통해 자신이 원래 하고 싶었던 뇌 연구를 자동차라는 영역에서 실현하고 있다. 모멘타가 테슬라와 다른 점은 독자적인 솔루션 제공 회사라는 점이다. 테슬라와 애플이 소프트웨어와 하드웨어를 동시에 만드는 회사라면, 구글은 안드로이드라는 소프트웨어를 삼성전자 같은 스마트폰 제조사들에 제공한다.

모멘타는 자동차를 직접 만드는 회사가 아니기에 안드로이드처럼 차량에 쉽게 탑재할 수 있는 다양한 자동운전 솔루션을 만드는 데 주력했다. 기술경영 관점에서 보면 테슬라나 애플은 수직 통합, 구글이나 모멘타는 수평 분업 전략을 택한 것이다.

이 전략은 성공적이었다. 모멘타는 토요타, 닛산, 혼다 등 일본 3사와 메르세데스-벤츠, BMW 등 유럽 업체들에 솔루션을 제공하고 있거나 제공할 예정이다. 모멘타도 조만간 앞서 언급한 월드 모델을 제공한다고 한다.

막대한 R&D 투자

인공지능 기반 자동운전, 특히 E2E와 월드 모델과 같은 최신 기술을 개발하기 위해서는 막대한 연구개발비가 필요하다. 실제로 최근 몇 년간 중국 완성차 메이커들의 연구개발비는 폭발적으로 증가했다. 왜냐하면 인공지능 연구는 본질적으로 막대한 연산 능력과 방대한 데이터가 뒷받침되어야만 가능하기 때문이다.

〈도표 1〉은 자동차 메이커들의 연구개발 비용 추이(좌측)와 2025년 1분기 매출액 대비 연구개발비 비중(우측)을 보여준다. 테슬라는 2020년 15억 달러였던 R&D 투자를 2024년 45억 달러(약 324억 위안)로 3배 늘렸다. 니오는 연구개발비를 25억 위안(2020년)에서 130억 위안(2024년)으로 5배 이상 늘렸다. 연간 약 50만 대를 판매하는 리샹은 2020년 11억 위안에서 2024년 111억 위안으로 무려 10배나 늘렸다. 2025년 1분기 기준 매출액 대비 연구개발비 비중을 보면, 니오가 26.4%로 가장 높고 샤오펑 12.5%, 리샹 9.7% 순이다.

이런 막대한 R&D 투자는 중국 특유의 집단적 경쟁 구조의 한 단면을 보여준다. 한 기업이 앞서 나가면 곧바로 수십 개 기업이 유사한 기술을 모방하며 따라붙는다. 중국의 자동차 테크 기업들은 지금 기술 개발에 사실상 모든 것을 걸고 있는 셈이다.

그렇다면 중국 자동차 산업은 어떻게 했기에 외국 선진 기업과 대등하거나 더 앞선 성취를 이룬 것일까? 이 본질을 이해하는 것은 앞으로 우리가 중국 기업과 벌일 경쟁에 있어서 중요한 승리 단서가 될 것이다.

이에 대한 하나의 해답으로 필자는 리쩌젠(李澤建) 오사카산업대 경제학과 교수가 2025년 5월 20일 자 《일본경제신문》 기고문에서 언급한 ‘무리 전략(群戰略·Swarm Strategy)’에 주목했다. 서양의 전략론은 대체로 개별 기업이 전제라 무리 전략과는 상반된다.

이에 필자는 리 교수와 영상 인터뷰를 통해 의견을 교환했고, 여러 검토 끝에 다음과 같이 정리해 보았다.

동물 세계에는 영역 전략과 무리 전략이 대립적으로 존재한다. 영역 전략은 강자가 자신의 구역을 지키며 독점적 이익을 추구하는 방식이다. 한국에서 직장 생활을 하다 보면 이런 배타적인 ‘텃세 싸움’을 곧잘 경험하는데, 이를 ‘나와바리(縄張り·새끼줄을 쳐서 영역을 표시한다는 뜻)’라는 일본 말로 부른다. 한국 직장인들에게는 무척이나 익숙한 용어다. 반대로 무리 전략은 약한 동물이 생존을 위해 택하는 방식이다. 정어리가 거대한 무리를 이루어 포식자를 혼란시키거나 아프리카 들소가 사자에 맞서 집단 방어하는 것이 그 예다.

즉 무리 전략은 자연계의 생존 방식일 뿐만 아니라, 후발 주자인 산업과 기업이 불리한 조건을 극복하는 집단적 학습 전략의 하나다. 사실 중국의 기업들은 산업화 측면에서 그 출발이 늦었기에 약자(弱者)였다. 미국이 일본에, 일본이 한국에 산업 기술을 이전했지만, 중국 기업에는 이전을 하지 않았다. 후발 주자로서 불리한 조건에 놓인 중국 기업들은 결국 서로 무리를 이루어 집단 학습과 진화를 선택할 수밖에 없었다. 이 선택이 의도된 전략이었는지, 아니면 본능적인 대응이었는지는 단정하기 어렵다.

집단적 진화

필자가 생각하는 중국 산업의 ‘무리 전략’ 작동 방식은 〈도표 2〉와 같다. 새로운 기술이나 제품이 등장하면 많은 중국 기업이 집단적으로 경쟁에 뛰어들어 큰 무리를 형성한다.

이때 개별 기업은 불완전한 정보만을 가지고 행동하지만, 무리를 이룬 집단은 다양한 경로를 통해 외부 정보를 흡수하고 새로운 시도를 거듭한다. 이 과정에서 성공한 기업이 나타나면 경쟁사들은 이를 신속히 분석해 그대로 복제하거나 변형해 시장에 내놓는다. 이렇게 모방과 변형이 반복되면서 산업 내 효율성이 높아지고 무리 전체의 성장으로 연결된다. 집단 전체가 유지될 수만 있다면, 개별 기업의 도산(倒産)은 큰 문제가 되지 않는다.

이런 과정을 거치다 보면 산업은 ‘집단적 진화’ 단계를 거쳐 한 단계 도약하고, 이후 또 다른 기술을 발견하면 이를 따라가며 다시 진화를 반복한다. 중국 소비자들도 이러한 패턴에 발맞추어 신제품을 소비한다.

돌이켜보면 과거 한국에도 이와 유사한 시기가 있었다. 금성사(현 LG전자), 삼성전자, 대우전자, 아남전자 등과 같은 전자 회사들이 서로 경쟁하면서 한 회사가 신제품을 출시하면 다른 회사가 곧바로 흉내 내어 유사한 제품을 출시하며 선전했다.

하지만 한국 기업들이 글로벌 기업으로 성장하면서 기업 규모에 비해 국내 시장은 상대적으로 작았다. 경쟁자도 사라지면서, 한국 기업은 어느 순간부터 영역 전략(나와바리 전략)에 익숙해졌다. 이러다 보니 중국처럼 거대한 시장에서 많은 기업이 무리를 지어 빠르게 움직이는 상황에 적응하기 점점 어려워졌다. 이것이 필자가 생각하는 중국 기업의 다이내믹스이며 동시에 한국 기업이 현재 중국 시장에서 어려움을 겪는 이유가 아닌가 생각한다.

중국 기업들과 손잡은 토요타

중국의 무리 전략에 우리는 어떻게 대응해야 할까? 2025년 상하이 모터쇼에서 토요타가 발표한 bZ7에서 힌트를 찾을 수 있다. 이 차에는 샤오미의 스마트 생태계, 화웨이의 HarmonyOS 5.0 인포테인먼트 시스템과 전동 구동 시스템, 그리고 모멘타의 최신 자동운전 솔루션이 탑재되었다. 2026년 3월 출시 예정인 이 차량에 대해 한 외신은 “화웨이, 샤오미, 모멘타가 토요타의 중국 전기차와 SDV 전략을 견인한다”라는 헤드라인을 달았다.

이는 단순한 기술 도입이 아니다. 세계 최대 자동차 메이커 토요타가 중국식 무리 전략과 걸음을 맞추겠다는 의지로 보인다. 필자가 2025년 6월 일본에서 만난 토요타의 한 관계자는 “토요타는 중국에서 상당히 많은 작업을 해왔고, 이제 겨우 중국에서 어떻게 일할지 체제가 정비되었다”고 털어놓았다.

거대한 무리를 이루고, 또 상황에 따라 유연하게 대형을 바꾸며 움직이는 중국 기업에 지금 한국 기업은 일종의 공포를 느끼고 있다. 적당한 수준의 공포는 우리를 분발하게 하지만, 필요 이상의 공포는 우리를 주눅 들게 한다. 상대방의 전략을 명확하게 인식한다면 충분히 대응할 수 있다. 결국 전략의 본질은 상대를 알고 나를 아는 데 있다. 중국 기업을 정확히 읽어내는 것이야말로, 한국 기업이 새로운 돌파구를 여는 출발점이 될 것이다.⊙