이전 글에서 고령인구비율 데이터 전처리에 이어, 이번 글에서는 지방자치단체의 세입세출 결산자료를 전처리하는 방법을 설명합니다. 지방재정365에서 제공하는 ‘성질별 단체별 세입(세출)결산’ 데이터셋을 다운로드 받아, 세입결산과 세출결산 통합 데이터프레임을 생성합니다. 이를 위해 여러 파일을 통합하고, 세목 분류를 정돈하여 최종적으로 자치단체별 세입과 세출을 계산합니다.…
해당 글은 고령인구비율 데이터의 전처리 과정을 설명합니다. 통계청 국가통계포털(KOSIS)에서 다운로드받은 데이터를 ‘고령인구비율(시도/시/군/구)’ 형태로 준비하고, 파이썬 버전 3.11.8을 사용하여 pandas를 통해 데이터를 가공합니다. ‘행정구역별(1)’ 컬럼을 짧은 형태로 변형, 불필요한 데이터를 제외하고, ‘자치단체명’ 변수를 생성한 후 필요한 컬럼을 선택하여 엑셀 파일로 저장합니다.…
지방재정 또는 지방행정 연구를 위해 데이터 전처리 과정을 연구하는 이 글은, “기초지방자치단체장”과 “광역지방자치단체장” 정당 일치 여부가 예산 집행률에 양의 영향을 미칠 것이라는 가설을 설정합니다. 필요한 변수는 종속변수 예산집행률과 독립변수인 정당 일치 여부, 통제변수로 재선 여부, 득표율, 고령인구비율입니다. 연구 데이터 테이블…
네이버에서 검색한 뉴스를 긁어오는 코드입니다. 각 홈페이지로 리다이렉트 되는 기사의 경우 주소의 일관성이 없어서 기사 내용은 불러오지 못 합니다. 앞의 “기사내용 포함하여 네이버 뉴스 수집하기”와 다른 점은 기사 내용은 긁어오지 못 하지만, 네이버 뉴스에서 검색해서 나타나는 모든 기사를 각 기사의 요약과…
네이버에서 검색한 뉴스를 긁어오는 코드입니다. 각 홈페이지로 리다이렉트 되는 기사의 경우 주소의 일관성이 없어서 기사 내용은 불러오지 못 합니다. 그래서 네이버 포털 자체에서 제공하는 뉴스 기사만 대상으로 기사 내용을 포함해서 수집합니다. 자세한 설명은 추후 시간이 날 때 하도록 하겠습니다. 아래는…
네이버 부동산에서 지역과 조건을 설정했을 때, 목록에 뜨는 각 매물들의 세부정보를 불러오는 코드입니다. 부동산 서비스들이 전부 매물의 세부정보(세부설명)에 대한 검색이나 손쉬운 열람을 허용하지 않아서 만들었습니다. 자세한 설명은 추후 시간이 날 때 하도록 하겠습니다. 아래는 코드 전문입니다. 전체코드
직방에서 지역과 조건을 설정했을 때, 목록에 뜨는 각 매물들의 세부정보를 불러오는 코드입니다. 부동산 서비스들이 전부 매물의 세부정보(세부설명)에 대한 검색이나 손쉬운 열람을 허용하지 않아서 만들었습니다. 자세한 설명은 추후 시간이 날 때 하도록 하겠습니다. 아래는 코드 전문입니다. 불필요한 코드들이 중간에 섞여 있습니다.…
통계청은 OpenAPI를 제공하고 있습니다. 자주 사용하는 KOSIS 사이트와는 달리, OpenAPI는 “KOSIS 공유서비스”라는 별도의 페이지에서 제공하고 있습니다.Json과 XML 형태로 데이터를 불러올 수 있으며, 회원가입 후 APIKey를 발급받아서 사용가능합니다. 간단하게 경기도 민원처리건수를 불러와보겠습니다. KOSIS 공유서비스에 로그인 후 “서비스이용”의 “통계자료”에서 “신청현황” 탭을 가시면,…
나눔로또에서 제공하는 API를 활용해서 로또 당첨번호를 불러오는 코드입니다. 우선 저장된 데이터가 있다면, 저장된 데이터를 불러옵니다. 그 다음에는 저장된 데이터가 있다면 그 다음 차수부터, 없다면 1회차부터 로또를 불러오도록 chasu변수를 설정해줍니다. 저는 기존 데이터를 df_raw라는 이름으로 불러왔습니다. 그리고 불러온 chasu변수를 활용하여 로또…
오늘은 나라장터에서 원하는 연구용역을 불러오는 작업을 수행하고자 합니다. 정부에서 발주하는 용역, 공사, 물품 등은 대부분 나라장터를 거쳐서 나옵니다. 물론, 아직도 많은 기관이 나라장터가 아니라 각 기관 홈페이지나 다른 방법을 통해 공고를 내는 경우가 많습니다. 덕분에 KBID처럼 다양한 기관의 공고들을 모아서…