도매시장 경락 데이터의 이해 - 상추

공공데이터 포털에서 open API 형태로 공개되어 있는 ‘농수축산물 도매시장 상세 경락가격’데이터에서 2015년부터 2018년 현재 시점까지의 상추 거래를 분석해보고자 한다. ’nrow()’로 총거래건수를 살펴보면 3,150,052건이다. pre code, pre, code { white-space: pre !important; overflow-x: auto !important; word-break: keep-all !important; word-wrap: initial !important; } library(plotly); library(dplyr); library(tidyr) ;library(ggplot2); library(gridExtra); library(knitr); library(kableExtra) dat <- read.csv('lettuce_all.csv') print(paste('number of observation :',nrow(dat))) ## [1] "number of observation : 3150052" 날짜별 거래건수를 합해서 내림차순으로 정렬해보면 거래가 많을 때는 하루에 6645건의 거래가 발생한 적도 있음을 알 수 있다.

도매시장 경락 데이터의 이해 - 당근

이번 Post에서 사용하는 데이터는 농림축산식품교육문화정보원에서 수집하여 공공데이터포털을 통해 제공되는 농수축산물 도매시장 상세 경락가격 Open API에서 수집한 데이터로 AWS S3 Agdata Lab 저장소에서 다운로드할 수 있다. 수집 기간은 2015년 1월부터 2018년 7월까지이며(정확히는 2018년 8월 1일) 전국 34개의 농산물 공영도매시장에서 거래된 당근 품목의 모든 데이터가 기록되어 있다. 먼저 csv파일을 읽어와서 dat 데이터로 저장하고 측정치 개수를 확인해보자. 그 결과 558,225개로, 총 43개월 중(2015년 1월 ~ 2018년 7월) 월 20일 도매시장이 개장되었다고 가정했을 때 하루 평균 거래 건수는 649.

도매시장 경락 데이터의 이해 - 대파

이번 post에서는 대파 도매시장 경락 데이터를 가공해 보고자 한다. 데이터는 앞서 배추 post에서 언급되었듯이 농림축산식품교육문화정보원에서 수집하여 공공데이터포털을 통해 제공되는 농수축산물 도매시장 상세 경락가격 Open API에서 수집한 데이터로 AWS S3 Agdata Lab 저장소에서 다운로드할 수 있다. 다만 수집 기간은 배추와 달리 2015년 1월부터 2018년 7월 30일까지이며, 배추와 마찬가지로 해당 기간 전국 농산물 공영도매시장에서 거래된 모든 대파 품목의 데이터가 기록되어 있다. 앞선 배추 관련 post들에서 데이터 가공 및 시각화와 관련된 R코드와 설명은 충분히 된 것으로 생각하고 이번 post는 대파 데이터 설명에 필요한 코드를 제외한 부분은 생략하고 결과를 중심으로 간략하게 작성하였다.

도매시장 데이터 가공과 시각화 - 배추(2/2)

앞선 Post에서는 가락시장을 중심으로 시각화를 해보았다면 이번 Post에서는 다른 도매시장들에서의 보다 구체적인 가격정보를 시각화하는 코드를 살펴보자. pre code, pre, code { white-space: pre !important; overflow-x: auto !important; word-break: keep-all !important; word-wrap: initial !important; } library(dplyr); library(tidyr); library(ggplot2); library(ggthemes); library(formattable); library(plotly) 필요한 패키지를 불러들인다. date0 <- 20180613 unit_list <- c('1kg','4kg','8kg','10kg','12kg') unit_df <- data.frame(unit2=c('1kg','4kg','8kg','10kg','12kg')) dat <- dat %>% mutate(unit_merg=paste(round(prut,0),unit,package,sep=''), mkt_short = substr(market,1,4)) date0l7d <- as.
도매시장 데이터 가공과 시각화 - 배추(1/2)

도매시장 데이터 가공과 시각화 - 배추(1/2)

농림축산식품 공공데이터 포털에서 제공되고 있는 도매시장 경락 데이터는 전국 도매시장의 모든 거래의 내용이 거래 건수 단위로 기록이 되어있다 참고. 배추의 경우 월 평균 2만2천 건 이상의 거래가 기록되고 있는데 이 방대한 raw 데이터를 어떻게 보여주는 것이 raw 데이터가 가지고 있는 여러 정보들을 효과적으로 전달할 수 있을까? 정해진 답은 없지만 한가지 확실한 것은 표와 그래프라는 틀에 넣었을 때 우리는 데이터의 의미를 보다 편하게 인지할 수 있다는 것이다.

도매시장 경락 데이터의 이해 - 배추(2/3)

PREV : 도매시장 경락 데이터의 이해: 배추(1/3) 지난 Post에 이어서 이상치로 판단되는 10,000원 이상의 kg당 가격 케이스를 삭제한 dat3 데이터를 이용하여 도매시장 경매와 관련한 각 변수들 간의 관계를 눈으로 확인해보자. 이번 Post에서는 Cross tabulation라고도 불리는 교차분석 방법으로 명목형(categorical) 변수들 간의 관계를 보려고 한다. 교차분석은 두 변수 간의 관계를 한 변수는 X축, 다른 한 변수는 Y축 방향으로 각 변수의 요소들을 나열하고 각각의 경우에 대한 연속형 변수의 값을 보여주는 것이다.
도매시장 경락 데이터의 이해-배추(1/3)

도매시장 경락 데이터의 이해-배추(1/3)

서울가락도매시장 30년 전 풍경, Thumbnail 이미지 출처 도입 파트 작성 예정 이번 Post에서 사용하는 데이터는 농림축산식품교육문화정보원에서 수집하여 공공데이터포털을 통해 제공되는 농수축산물 도매시장 상세 경락가격 Open API에서 수집한 데이터로 AWS S3 Agdata Lab 저장소에서 다운로드할 수 있다. 수집 기간은 2002년 1월부터 2018년 4월까지이며 전국 34개의 농산물 공영도매시장에서 거래된 배추 품목의 모든 데이터가 기록되어 있다. 먼저 csv파일을 읽어서 dat 데이터로 저장하고 측정치 개수를 확인해보자. nrow()로 확인해본 결과 6,025,998개이다.