Analysis of Multi-Climate Controller Data in Tomato Greenhouses (랩스터디)

180404 yeonjin from SeungHyeonSeo2 코멘트 성제’s comment 해당 논문은 다양한 생육 변인들을 고려하여 토마토 생산성을 증진 시킬 수 있는 최적의 방법론을 찾는 것을 목표로 한다. 이때 이전 논문들이 사용하였던 선형회귀모델의 문제점을 제시하며 비선형회귀모델과 선형회귀모델의 비교를 통해 토마토 생육 모델에 더 적합한 것이 무엇인지 밝혀내고자 한다. 생육 변인들의 critical point에서 변동하기 때문에 선형모델 대신에 비선형모델을 선택한 점은 긍정적이다. 하지만 지역적 요인을 고려하지 않은 것은 아쉽다. 데이터의 한계가 주요한 원인이겠지만 한 지역의 1년간 데이터만으로 토마토 생육 모델을 비교하기에는 한계가 있을 것으로 판단된다.

GLM을 이용한 대학학업성취도 분석

GLM을 이용한 대학학업성취도 분석 from SeungHyeonSeo2 코멘트 성제’s comment 본 논문은 혼잡한 입시제도 속에서 대학교육 개혁의 방향성 제시라는 큰 틀에서의 목표를 위해 연구를 진행하였다. 연구에서는 대학생들의 학업 성취도 지표를 평점평균으로 정하고 평점평균과 다양한 요인 사이의 관계를 일반화선형모형을 통해 분석했다. 요인으로는 수학능력시험 성적, 고교내신 성적, 성별, 출신지역(고교), 입학전형, 기숙사 입사 여부, 전공학과 등을 고려하였다. 이 연구에서는 일반화선형모델을 따라 선형회귀계수를 추정하였다. 이때 계수를 통해 종속변수의 변화를 분석하고 계수 간의 기여도 차이를 비교하기 위해 설명변수를 표준화 시켜 표준화 선형회귀식을 도출하였다.

대형마트 영업규제에 따른 소비자의 식품소비지출 변화 분석

Mart from YeonjinKim18 코멘트 성제’s comment 본 논문은 대형마트 영업규제에 따른 소비자의 식품소비지출 변화를 이중차분법을 통해 분석하고 있다. 더 나아가 일요일과 그렇지 않은 요일을 구분해 삼중차분법을 통해 소비지출 변화를 분석한다. 선행연구들과의 차별점으로는 소비자의 인구사회적, 소비행태적 요인을 추가했다는 점을 들고 제시한다. 본 논문에서는 두 집단(처리집단, 통제집단)의 성장세와 변화추세가 동일하다는 가정을 하고 있다. 하지만 이러한 가정이 소비지출 변화를 분석하는 데 있어 적절한 것인지에 대해 생각해 볼 필요가 있다.

동물복지형 축산물에 대한 사전적 수요함수 추정

180523 animal welfare from Sungjay Kim 코멘트 진용’s comment 본 연구는 동물복지형 축산물에 대한 사전적 수요함수를 추정한다. 동물복지형 축산물의 가격 및 수량 데이터가 없기 때문에, 이 논문은 소비자 설문조사를 바탕으로 그 수요함수를 추정하는 방법론을 사용하고 있다. 동물복지형 축산물의 수요곡선을 도출할 때, 동물복지형 축산물로 수요가 이동하면서 생기는 일반 축산물의 가격하락은 고려하지 않아도 되는가? 구입할지 구입하지 않을지에 대한 의향이 반반이라고 응답한 응답자의 50%를 구입의사가 있는 소비자로 분류해도 되는가?

소득수준별 간편식 소비 비교

180321 a comparison of convenience food consumption among different income levels in south korea from Sungjay Kim 코멘트 진용’s comment *ANOVA모델과 다중회귀분석을 이용하여 소비계층에 따라 편의식품에 대한 소비가 어떻게 달라지고, 또 편의식품에 영향을 미칠 수 있는 변수들이 각각의 소비계층에서 어떻게 존재하는지를 알아보는 논문이었다. 분석의 종속변수는 ‘전체 식비 대비 편의식품의 비율’이 사용되었으며 여기서 편의식품은 전체 식사를 대체할 수 있는 식품과(Unhealthy) 식단 중 부분을 대체할 수 있는 식품(healthy)로 나뉘는데, 전자는 소득이 낮을수록 후자는 소득이 높을수록 그 비율이 커지는 경향이 확인되었다.

표고버섯 단기 가격 예측을 위한 시계열 모형 비교

Mshrm from YeonjinKim18 코멘트 성제’s comment 본 논문에서는 여러 시계열 방법론을 활용하여 등급별 표고버섯의 단기 가격을 예측하고 그 정확도를 비교하는 연구를 진행하였다. 표고버섯은 품질에 따라 특, 상, 중품으로 구분하였다. 시계열 방법론은 계절성 더미모형, 지수평활법, 상수항을 뺀 SARIMA, 상수항을 포함한 SARIMA 등을 활용했다. 이 논문은 시계열 방법론을 활용해 표고버섯의 단기 가격 예측 모형을 만들었는데 표고버섯의 등급을 구분하는 다는 점, 여러 방법을 비교해 예측력을 비교한 점은 주목할만하다.

도매시장 데이터 가공과 시각화 - 배추(2/2)

앞선 Post에서는 가락시장을 중심으로 시각화를 해보았다면 이번 Post에서는 다른 도매시장들에서의 보다 구체적인 가격정보를 시각화하는 코드를 살펴보자. pre code, pre, code { white-space: pre !important; overflow-x: auto !important; word-break: keep-all !important; word-wrap: initial !important; } library(dplyr); library(tidyr); library(ggplot2); library(ggthemes); library(formattable); library(plotly) 필요한 패키지를 불러들인다. date0 <- 20180613 unit_list <- c('1kg','4kg','8kg','10kg','12kg') unit_df <- data.frame(unit2=c('1kg','4kg','8kg','10kg','12kg')) dat <- dat %>% mutate(unit_merg=paste(round(prut,0),unit,package,sep=''), mkt_short = substr(market,1,4)) date0l7d <- as.
도매시장 데이터 가공과 시각화 - 배추(1/2)

도매시장 데이터 가공과 시각화 - 배추(1/2)

농림축산식품 공공데이터 포털에서 제공되고 있는 도매시장 경락 데이터는 전국 도매시장의 모든 거래의 내용이 거래 건수 단위로 기록이 되어있다 참고. 배추의 경우 월 평균 2만2천 건 이상의 거래가 기록되고 있는데 이 방대한 raw 데이터를 어떻게 보여주는 것이 raw 데이터가 가지고 있는 여러 정보들을 효과적으로 전달할 수 있을까? 정해진 답은 없지만 한가지 확실한 것은 표와 그래프라는 틀에 넣었을 때 우리는 데이터의 의미를 보다 편하게 인지할 수 있다는 것이다.

도매시장 경락 데이터의 이해 - 배추(2/3)

PREV : 도매시장 경락 데이터의 이해: 배추(1/3) 지난 Post에 이어서 이상치로 판단되는 10,000원 이상의 kg당 가격 케이스를 삭제한 dat3 데이터를 이용하여 도매시장 경매와 관련한 각 변수들 간의 관계를 눈으로 확인해보자. 이번 Post에서는 Cross tabulation라고도 불리는 교차분석 방법으로 명목형(categorical) 변수들 간의 관계를 보려고 한다. 교차분석은 두 변수 간의 관계를 한 변수는 X축, 다른 한 변수는 Y축 방향으로 각 변수의 요소들을 나열하고 각각의 경우에 대한 연속형 변수의 값을 보여주는 것이다.
도매시장 경락 데이터의 이해-배추(1/3)

도매시장 경락 데이터의 이해-배추(1/3)

서울가락도매시장 30년 전 풍경, Thumbnail 이미지 출처 도입 파트 작성 예정 이번 Post에서 사용하는 데이터는 농림축산식품교육문화정보원에서 수집하여 공공데이터포털을 통해 제공되는 농수축산물 도매시장 상세 경락가격 Open API에서 수집한 데이터로 AWS S3 Agdata Lab 저장소에서 다운로드할 수 있다. 수집 기간은 2002년 1월부터 2018년 4월까지이며 전국 34개의 농산물 공영도매시장에서 거래된 배추 품목의 모든 데이터가 기록되어 있다. 먼저 csv파일을 읽어서 dat 데이터로 저장하고 측정치 개수를 확인해보자. nrow()로 확인해본 결과 6,025,998개이다.