-
환경 빅데이터에 새로운 가치와
생명력을 불어넣다- 글 김민선
- 사진 김준후
- 구슬이 서 말이라도 꿰어야 보배라는 속담을 실감하게 하는 것이 데이터다. 방대한 양의 빅데이터는 그저 데이터로만 있을 때 보다 체계적으로 활용되어 정보로 재생산됐을 때 빛을 발한다. 환경 데이터도 마찬가지다. 이전에는 환경부와 산하기관들은 자체적으로 필요한 환경 데이터를 확보하고 빅데이터 분석을 진행하였다. 그러다보니 데이터 공유와 수집에 어려움이 있었고, 분석결과 공유와 협업이 힘든 구조였다. 또, 데이터 작업 과정에 자동화 기능이 적용되지 않아 활용에 어려움도 있었던 것. 이렇게 구슬을 꿰고, 구슬을 꿸 수 있도록 도움을 주는 곳, 더욱더 많은 구슬을 쉽고 편리하게 꿰는 환경행정기반을 마련하는 곳이 한국환경공단의 빅데이터관리부다.
빅 데 이 터 관 리 부
흩어진 환경정보를 한곳에
“한국환경공단은 환경부 산하의 종합환경전문기관으로서 기후대기·물환경·자원순환·생활환경 등 다양한 환경 매체와 관련된 사업을 수행하고 있으며, 이를 지원하기 위한 70여 개의 정보시스템을 운영하고 있습니다. 공단은 다양한 환경매체에서 수집되는 방대한 데이터에 대한 축적된 경험과 깊은 이해도를 가졌습니다. 이를 기반으로 한 우리 공단만이 보유하고 있는 경험과 지식은 환경정보 융합 빅데이터 플랫폼을 성공적으로 구축하고 안착시키는 데 필요한 요소이며 빅데이터관리부는 이를 소명이라 생각하고 수행 중입니다.”
한국환경공단 빅데이터관리부는 2018년도부터 구축·운영 중인 환경정보 융합 빅데이터 플랫폼 사업을 2022년까지 총 5년에 거쳐 진행 중이다. 이 사업은 환경 분야 민원 분석 서비스를 포함한 다양한 분석과제를 데이터 분석을 위한 참고자료로 활용하기 위해 빅데이터로 제공하는 것이다. 이를 통해 대기·자연·물·상하수도 등 정부·공공영역에서 구축한 환경 정보를 연계한 데이터 허브를 구축하는 동시에, 인터넷포털이나 SNS 상의 비정형 데이터까지 수집해 관련 정책과 산업을 뒷받침하는 인사이트를 제공한다는 계획이다.
“환경정보 융합 빅데이터 플랫폼 운영에서 가장 중점적으로 생각하는 부분은 빅데이터·플랫폼을 활용하는 사용자입니다. 데이터에 대한 1차원적인 접근방식에서 벗어나 새로운 가치 창출을 해낼 수 있는 중요한 자원이라는 사용자의 인식 전환이 무엇보다 필요합니다. 환경정보 융합 빅데이터 플랫폼은 이러한 사용자의 인식 전환을 돕고 지원하기 위한 유용한 도구로서 역할을 수행할 수 있어야 합니다. 이를 위해 빅데이터관리부는 사용자의 다양한 목소리를 듣기 위해 노력을 기울이고 있습니다.”
“데이터, 자원이자 공단의 미래, 대한민국의 미래”
플랫폼에 서비스될 빅데이터는 환경정보 포털 사용자를 대상으로 희망 데이터 조사와 분석활용을 위한 데이터 목록 선발 등 사전 준비과정을 거쳐 연계, 수집 대상 데이터 후보군을 선정한다. 이후 후보 시스템 담당자와 인터뷰를 통해 연계 가능한 해당 데이터의 특징, 연계방식 등을 정리해 연계할 데이터를 최종 선정하는 방식이다. 사업이 본격적으로 시작되면 인터뷰 내용을 바탕으로 데이터 연계 작업을 진행하고 정제해 사용자에게 제공한다는 계획이다.
“환경정보 융합 빅데이터 플랫폼이 진정한 플랫폼, 포털의 역할을 수행할 수 있으려면 사용자의 일상과 함께하는 유용한 도구가 돼야 합니다. 사용자가 필요로 하는 데이터의 위치를 쉽게 찾고 접근할 수 있어야 하며, 사용자 간 데이터를 쉽게 주고받고 부족한 지식을 보완해 줄 유용한 교육이 이뤄져야 하죠. 또 함께 분석하고 그 결과를 플랫폼에서 공유도 할 수 있어야 하고요. 그래서 빅데이터관리부의 분석 활성화 파트는 마치 ‘사서’ 같아요. 도서관의 사서가 자료를 검색하고 확인하듯이, 분석 활성화 파트도 다양한 데이터 속 업무와 분석에 필요한 자료를 찾기 위해 노력하고 있거든요. 인프라 운영파트는 백조라고 표현하고 싶어요. 우아하게 떠다니는 백조이지만, 수면 아래를 보면 그 발은 쉴 새 없이 움직이며 물장구를 치잖아요. 인프라 운영파트도 항상 일정한 수준의 포털 운영과 데이터 제공을 위해 열심히 노력하고 있기 때문입니다.”
사용자가 사용하기 편한 플랫폼 구축을 목표로
환경정보 융합 빅데이터 플랫폼에서의 데이터는 단순히 데이터만을 제공하는 데서 그치지 않는다. 빅데이터 분석은 보통 주제선정-데이터 확보-알고리즘 선정-분석 수행-결과제공 및 활용의 과정을 거쳐 진행된다. 그러므로 포털도 이에 맞춰 데이터 수집-수집데이터 저장- 분석 도구( 알고리즘) 지원-분석 서비스 제공이라는 4가지 범주로 시스템을 구성하며 이를 빅데이터관리부가 제공하고 있다. 빅데이터관리부는 하루가 다르게 모이는 데이터, 그리고 정보기술을 익히는 데에도 주안점을 두어야 하는 곳이다. 이에 실제 빅데이터관리부는 부족한 시간을 쪼개어 빅데이터 분석기사를 취득하는 등 데이터 분석과 활용 전문성을 키우기 위한 노력도 게을리하지 않고 있다. 빅데이터관리부가 현재 중점적으로 진행하는 업무는 수집된 데이터와 구축된 플랫폼을 활용해 환경 분야 데이터 기반의 행정 활성화를 지원하는 것이다. 수질·대기·자원순환 사업장 데이터를 하나로 아우르는 ‘기준코드’를 제작 및 배포해 직원들의 원활한 분석 수행을 지원한다. 자체 분석 과제(선도과제)를 발굴한 뒤 수행, 그 결과를 포털에 제공해 환경 분야의 빅데이터 분석 방향성을 제시하기도 한다.
“데이터는 자원이며 공단의 미래, 대한민국의 미래입니다. 과거 일회성 행정자료로 활용된 후에는 방치되거나 버려진 데이터는 이제 고부가가치 창출을 위한 소중한 자원이 되어 데이터를 어떻게 활용하느냐가 그 기업의 경쟁력이자 가늠자가 됐습니다. 또한 데이터에 대한 폐쇄적 소유권을 주장하던 시대는 이제 역사 속으로 사라져 정부와 공공기관은 보유한 데이터를 서로 공유해야 하는 법적 의무가 부여된 셈이지요. 데이터 기반 행정 활성화를 위한 첫걸음은 기관이 보유한 정형, 비정형 데이터의 현황을 명확히 파악하는 것으로부터 시작합니다. 그다음 데이터의 효율적인 관리와 활용을 고민하고 행동해 나가는 자세도 수반돼야 하고요. 빅데이터관리부는 공단이 보유한 방대한 빅데이터라는 소중한 자원을 각 부서에서 더욱 효율적으로 활용할 수 있도록 앞장서서 고민하고 행동하고자 합니다. 환경정보 융합 빅데이터 플랫폼, 그리고 환경데이터 포털에서 우리 환경 일꾼들이 마음껏 데이터를 활용할 수 있도록, 그곳에서 성취감과 희열을 느낄 수 있게 함께해 나가겠습니다.”
-
- 환경정보 융합 빅데이터 플랫폼
- 환경부·소속기관·산하기관 사용자들이 데이터 기반 행정 및 업무수행을 지원하기 위해 환경 및 각종 분야에서 수집된 데이터를 분석해 제작한 서비스다. 기관별, 매체별로 분산 관리되는 환경데이터를 연계·융합하는 ‘환경정보 융합 빅데이터 플랫폼’을 구축해 데이터 기반의 과학적인 정책 의사결정 지원을 한다.