data.go.kr이 모은 전국 공공기관의 데이터셋 카탈로그. 어디에 무엇이 쌓여 있는지, 누가 채웠는지, 사람들은 어디로 쏠리는지 한 화면에서 본다.
2013년 박근혜 정부 출범과 함께 시작된 공공데이터 개방은 2019년 1만 건을 넘기며 본격화됐다. 2021년 정점을 찍은 뒤로도 매년 1만 건 이상이 새로 등록된다.
16개 대분류로 펼쳐진 카탈로그. 공공행정이 가장 크고, 문화관광·산업고용·교통물류·환경기상이 뒤를 잇는다. 사각형이 클수록 데이터 수가 많다.
9.5만 개 중 사람들이 실제로 보는 건 극소수. 상위 1%(약 956개)가 전체 조회의 17%를 가져가고, 상위 10%가 절반을 넘긴다. 긴 꼬리는 길고, 가늘다.
조회수 0~2,000 사이에 78,000개가 묻혀 있다.
서울특별시·행정안전부·경기도가 양적으로 압도적. 기관마다 색깔이 다르다 — 국토부는 교통·국토에, 기상청은 환경기상에, 통계청·국세청은 공공행정·재정금융에 집중한다.
상위 25개 제공기관 × 16개 대분류 · 셀 안 숫자는 등록 건수
지자체가 각자 자기 데이터를 따로 등록하다 보니, 같은 주제가 잘게 쪼개진다. "도서관"이라는 키워드 하나에 1,078건이 걸리고, 그게 235개 기관에 흩어져 있다. 그 파편들을 모으려는 게 "표준데이터"(STD) — 가운데 점이 그 표시다.
건수 제공 기관 수 표전국 표준데이터 존재
조회수 기준. 클릭하면 공공데이터포털의 원본 페이지로 이동한다.
조회수 200 이하의 잊혀진 데이터에서 무작위로 셋. 새로고침할 때마다 바뀐다 — 8만 개가 묻혀 있으니, 같은 것 두 번 보기 어렵다.
95,623개 전체를 검색·필터로 훑는다. 단어 한 번에 결과가 줄어든다. 카드 클릭은 공공데이터포털 원본으로.