교통빅데이터 세상, 정보연계는 ‘필수적’
상태바
교통빅데이터 세상, 정보연계는 ‘필수적’
  • 교통신문 webmaster@gyotongn.com
  • 승인 2017.09.12
  • 댓글 0
이 기사를 공유합니다

강동수박사의 교통안전노트

[교통신문] 전문가들은 오늘날 인터넷 없는 삶을 생각할 수 없는 것처럼 멀지않은 장래에 빅데이터 없는 삶을 상상할 수 없을 것이라 한다. 마케팅, e-커머스, 금융, 의료, 통신, 과학, 교통·물류, 소셜네트워킹 등 모든 분야에서 빅데이터를 활용하고 있고, 그 수요는 더욱 급증할 것이다.

빅데이터는 사물인터넷(IoT), 인공지능(AI), 클라우드 컴퓨팅 등과 함께 제4차 산업혁명을 견인하는 핵심기술이지만, 동시에 제4차 산업혁명의 발전을 위협하는 요인이기도 하다. 빅데이터의 활용으로 업무의 정확성, 생산성과 효율성이 크게 향상되고 실시간 예측이나 대응 능력은 높아지겠지만 개인정보나 위치정보와 같은 민감정보가 유출 또는 해킹되는 등 사생활 침해라는 역기능도 동반하게 된다. 심심찮게 국내 웹 포털 사이트와 금융권의 개인정보 유출이 사회문제화 되면서 다수의 국민들은 나도 예외일 수 없다는 생각에 민감하게 반응한다.

빅데이터 정보는 식별가능 여부에 따라 익명정보(pseudonymous data)와 비식별정보(anonymouse data)로 나뉜다. 유럽은 익명정보 중심의 데이터 활용 정책을 채택하고 있다. 익명정보는 그 자체로는 식별성이 없지만 별도 보관된 다른 정보와 결합하면 식별이 가능한 정보를 말한다. 이런 위험성으로 인해 유럽에서도 익명정보는 공식기록, 통계, 과학 및 역사 연구 등으로 활용범위를 제한하고 있다.

반면 비식별정보는 다른 어떤 정보와 기술로도 재식별할 수 없는 정보를 말하는데, 단순한 통계가 그것이다. 우리 정부가 발표하는 거의 모든 교통데이터가 여기에 해당한다. 다양한 빅데이터 기술로도 식별이 불가능하다면 데이터로서 가치가 없거나, 있다 해도 사실상 죽은 데이터라 할 수 있다. 우리나라는 개인정보보호법 제3조제7항에 따라 익명정보 방식을 채택하고 있지만 유럽처럼 익명정보에 대한 정의나 기준, 판례가 없다. 정부나 통계작성기관은 익명정보라고 하면서 실제로는 재식별이 완전히 불가능한 것만을 공개 가능한 데이터로 분류하고 있다.우리나라 교통부문의 빅데이터는 이미 수년 전부터 수집되고 있다. 디지털 운행기록장치가 1톤 이하 화물자동차를 제외한 모든 사업용 차량에 설치가 의무화 되어 2012년부터 1초 단위의 운행기록이 저장되고 있다. 각 지역마다 ITS 센터들이 구축되어 데이터를 쌓아온 지도 꽤 오래됐다. 전국적인 BIS 시스템은 세계 어느 나라보다 먼저 도입됐고, 버스·지하철의 교통카드 이용률은 이미 90%를 넘어섰다. 그럼에도 불구하고 아직까지 교통빅데이터가 건강보험 등 다른 분야의 빅데이터나 다른 나라의 수준에는 훨씬 미치지 못하고 있다. 서울시에서 교통카드 데이터를 유동인구와 결합시켜 심야시간 대 통행패턴을 분석했고 이를 기반으로 심야버스 노선을 선정하기도 했지만 대부분 그 활용 수준이나 실적은 미미한 편이다.

디지털 운행기록에는 다양한 정보가 들어있다. 교통안전공단과 운수회사에서 자체적으로 분석·활용하고 있기는 하지만 디지털 운행기록이 경찰청의 교통사고 데이터와 결합이 되기만 하면 차량단위의 안전관리가 가능하게 된다. 각 개별차량의 위험운전 행위가 교통사고로 어떻게 이어지며 어떤 노선이나 시간대 등에서 위험한 행동을 하며 사고가 발생하는지 등을 알 수가 있다.

더 나아가 디지털 운행기록을 기반으로 국토교통부의 자동차전산망의 자동차등록정보나 지자체의 BIS 버스운행정보 등과 통신사 기지국 데이터를 활용하여 유동인구 데이터와 스마트폰 네비게이션 이용자 정보 등 민간 정보와 결합하게 된다면 매우 유용한 정보가 생성될 것이다.

빅데이터는 비밀노출 위험도에 따라 원시 자료(raw data), 중간가공자료, 통계작성 기초자료(micro data) 및 단순 통계 등 네 가지가 있다. 국토교통부나 경찰청에서 통계작성기관인 공공기관에 제공하는 데이터는 대부분 단순 통계일 뿐이다. 통계작성 기초자료에는 차량등록정보나 주민등록번호 등 민감정보(키값)가 포함돼 있기 때문에 보안을 이유로 정부가 공공기관 등 외부기관에 제공하길 주저하는 것이다.

정부의 입장도 이해한다. 공공기관이든 민간이든 민감정보를 제공하지 않으면 개인정보 등의 유출문제는 애초에 생기지도 않는다. 제공과정에서 개인정보 등 민감정보의 유출을 가장 우려하지만 행정망을 통해 안전하게 통계작성기관에 보내졌다고 해도 통계작성기관 내부의 관리·분석하는 과정에서 유출이 될 수 있음을 우려한다. 그러나 통계작성기관은 정부 데이터에 대한 기밀 유지와 보안체계는 이미 확립이 된 상태다. 만약에 유출이 된다면 모든 책임은 통계작성기관이 다 져야할 것이다.

지난 9월2일 천안논산 고속도로에서 졸음운전 사고로 2명의 사망자가 발생했다. 사업용 운전자의 졸음운전이 계속적으로 사회문제가 되고 있지만, 위험운전자를 분류하고 위험한 운전행태를 차단하기 위해서는 빅데이터를 통한 차량단위의 체계적인 관리가 선행되어야 한다. 정부가 빅데이터를 제4차 산업혁명의 핵심 사업으로 추진하겠다고 하면서 정작 실제 자신이 위탁 운용하는 시스템에서 교통정책 개발이나 사고예방에 유용하게 쓸 수 있는 데이터 생성을 막고 있는 것은 아닌지 생각해볼 때다.

<객원논설위원‧교통안전공단 교통안전연구개발원장>

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.