철도자료의 다차원 네트워크 분석
상태바
철도자료의 다차원 네트워크 분석
  • 교통신문 webmaster@gyotongn.com
  • 승인 2021.08.27
  • 댓글 0
이 기사를 공유합니다

필자는 지방에 갈 기회가 있으면 늘 철도역이나 지역의 박물관에 들리곤 한다. 그곳에 있는 관련 자료로 당시의 상황을 좀 더 소상하게 알고 때로는 새로운 역사적 사실에 놀라기도 한다.

이제 자료가 있으면 최근 연구기법인 빅데이터 등으로 다양한 분석 결과와 상황(context)을 좀 더 깊이 그리고 소상하게 알 수 있다. 필자는 최근 타 분야의 사례를 통해 다차원 네트워크 분석(Multidimensional Social Network Analysis)을 공부하는 기회가 있었다.

캐나다 칼턴대학의 숀 그래이엄(Shawn Graham) 교수는 그의 책 ‘Exploring big historical data’에서 빅데이터의 역사적 해석을 설명하면서, 기존의 질적 데이터가 현미경, 망원경 정도의 범위를 의미했다면, 빅데이터 현상은 거시적 범위의 해석이 가능하기 때문에, 한층 더 포괄적이고 시대변화에 발맞춘 연구가 가능하다고 설명했다.

이와 같은 거대 사회적 영향력을 다양한 관점으로 분석하고 시각화하여 통찰 기회를 제공하는 분석방법론이 빅데이터 기반의 다차원 네트워크 분석이다. 네트워크 분석의 핵심은 구조에서 정체(identity) 파악할 수 있다는 세계관이다.

다차원네트워크 분석을 수행하는 분석가들은 주로 특허, 논문, 국가과제, 도서, 출원자, 연구자, 기관, 기업, 저자 영역별로 각각 용어네트워크를 분석해 어떤 기술과 기업, 연구자, 과제, 논문, 특허 등이 중요하고 영향력이 있는지를 네트워크로 시각화하고 목록으로 보여준다. 검색 문장으로 주요 논문과 논문 간 관계를 한 눈에 알 수 있으며, 특허와 특허 간, 기업 간, 연구자 간, 주요 기술 간 관계를 파악할 수 있고, 그 관계(구조) 속에서 각각의 정체가 드러난다.

2차원 네트워크를 시각화한 소시오그램에서는 연결/매개/근접 중심성이 높고 영향력 있는 (기술)용어를 찾아낼 수 있다면, 다차원네트워크분석은 여러 영역(특허, 논문 등)을 동시에 분석하고, 영역 간 전환(conversion) 검색 및 통찰할 수 있는 기회를 제공한다.

예를 들면, ‘인공지능 자율주행자동차’를 검색하면 논문 네트워크 분석을 통해 ‘디지털’, ‘무인자동차’를 중심으로 키워드가 분포함을 알 수 있고, 특허 네트워크의 경우는 ‘음성요청’, ‘실시간’이라는 토픽 중심으로 모여 있음을 알 수 있다. 주요 키워드별로 관련 특허와 논문을 식별할 수 있으니 즉시 문서열람도 가능하다.

또한 시계열 네트워크 분석도 가능하여 흐름에 따른 기술, 특허, 주요 플레이어의 변화나 기술수명주기나 영역별(논문, 특허, 국가과제 등) 기술격차를 알 수 있다.

얼마 전 부산시에서는 버스에 대한 버스 이용자의 민원을 파악하기 위해 기존 빈도위주 데이터 분석을 시행했는데 노선, 차량증편, 배차 간격, 운행시간, 정류장 등이 순서로 나타났으며 시간적으로 변하는 것을 알 수 있었다. 이를 통해 노선과 차량증편에 대한 정책을 수립할 수 있었다.

빈도분석 이상 네트워크지표를 이용한 다차원네트워크 분석을 철도에 적용한다면, 철도 영역의 주요 토픽과 토픽을 구성하는 기술(용어)들의 영향력과 시대별로 어떻게 등장했는지, 밀접하게 사용되는 기술(용어), 관련 학문과 특허, 지역별 관심사, 국민의 관심 등 다양한 분석이 가능할 것이다. 또한 신문자료(big kinds) 등 각종 데이터베이스를 공개하고 있어 분석의 영역을 다차원으로 확장 및 전환하여 보다 편리하게 탐색하고 기회를 포착할 수 있을 것이다.

최근 국토교통부에서 과제로 추진하고 있는 철도표준화 용어연구도 비슷한 과정을 밟고 있다. 주요한 용어가 관련 문헌과 현장 그리고 언론 등에 얼마나 도출됨을 분석해 중요도와 표준화 필요성 등을 파악하고 있다. 국토교통부가 2015년 고시한 전문용어가 학술정보시스템과 신문검색시스템인 카인즈에서 쓰인 빈도를 보면 편성, 열차시격, 운행시격 등의 단어가 그간 많이 노출됐다.

또한 철도공사의 차량규정집의 주요단어는 약 800개로 그중 차량의 종류가 103개, 전기차 관련이 74개, 브레이크부품 관련이 64개, 차량칫수가 29개로 규정집은 차량의 종류와 전기차 관련이 많이 분포함을 알 수 있다.

또한 검표를 하지 않는 코레일 개찰 시스템은 이미 높은 의식수준의 시민들, 그 사회적 영향력으로 실행가능한 체계라는 것을 알고 있다. 현재 시민들의 사회적 영향력은 과연 어떤 네트워크 소시오그램으로 나타날까? 무엇이 무검표 개찰을 가능하게 했을까? 지금 이 시점 시민들의 무검표 개찰에 대한 의견을 네트워크분석하면 알 수 있다. 시민들의 사회적 영향력을 고려하면 새로운 전략적 기회를 포착할 수 있다. 또한 타 영역, 타 학문과의 전환 가능하고 융합적인 연구도 더 활발하게 수행할 수 있을 것이다.

이러한 철도영역연구를 다차원네트워크 분석으로 활발하게 진행한다면 철도에 대한 연구와 관심이 더욱 깊어질 것이며, 정책결정자, 연구자를 포함해 사회기간망 서비스로써 접점을 형성하고 있는 시민의 사회적 참여와 영향력을 이해할 수 있고 시민들이 보다 철도를 쉽게 이해하는데 도움을 줄 수 있다.

빅데이터 시대에 우리는 다양한 주체의 막대한 사회적 영향력을 고려해 새로운 실용적인 분석 기법 등으로 적극적 분석하고 활용한다면, 그 동안의 문제를 해결하는 다양한 관점과 기회를 찾을 수 있다. 철도와 4차산업, 새로운 에너지인 수소에너지 등과의 관련성, 철도에 대한 국민의 관심, 역사적 자료의 분석 등에도 도움이 될 것이다.

이제 좀 더 적극적으로 철도 그리고 철도와 관련한 다양한 정형 또는 비정형자료를 통합하고, 그 체계 또한 디지털전환(Digital Transformation)할 필요가 있다. 그리고 다차원네트워크 분석 등을 수행할 빅데이터 기반 분석프레임워크와 다양한 분석방법론을 도입하고 활용하는 노력이 필요하다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.