Orange3 데이터분석 - 선형회귀(Linear Regression)

Orange3 데이터분석 - 선형회귀(Linear Regression) 

https://www.youtube.com/watch?v=MLrGQkQ0mnk

1. 간단한 선형 회귀 모델을 만들고, 데이터를 준비하고, 모델 선택 및 학습을 거쳐 결과를 시각화. 데이터를 다루고 모델을 설정하며 테스트


2. 모델 선택 및 데이터 설정

선형 핵심 애니메이션 모델을 선택하여 훈련하며, 데이터는 이전에 작성한 틀에 기반한 CSV 파일로 구성됨.

모델 설정 시 입력값이 5개인 위젯 화살표와 레이블을 통해 구성되며, 새로운 데이터는 평가를 위한 데이터로 추가되어 '트레인'과 '테스트'로 구분.

데이터 파일을 읽어와서 확인한 후, '테스트집' CSV 파일을 읽어 인스턴스 5개와 feature 1개가 있는 적은 데이터 확인 가능.

파일에 로미싱도 없고, 타겟도 없으며 데이터가 제한적이라 창을 닫음.


3. 데이터의 '프리딕션' 시각화 및 조정

'밸리데이터'에서 '프리딕션' 가져와 새 데이터 및 모델을 연결하며, 선형 회귀 모델 결과 시연 및 시각화.

모델에 새로운 데이터를 입력하여 예측값 확인, 스케텝 플러스를 활용한 시각화, 결과값 시각적 확인 및 설정 변경 가능.

추세선과 그리드 라인을 표시하여 데이터 시각화 및 조정 가능.

입력 및 출력 값, 결과 시각적으로 확인 및 설정 조절 가능.


4. 모델 예측과 시각화 확인

모델 예측을 위해 시각화를 통한 결과 확인이 필요하다.

다양한 모델 중 선형회귀셋이 적합함을 확인하며, 사용할 수 없는 모델들은 삭제한다.

연결 및 예측을 통해 여러 모델 중 리니어 리그레이션이 적합함을 확인한다.

사용하지 않는 모델은 삭제하여 적합한 모델을 선택한다.


5. Python 코드를 Orange로 시퀀셜 모델을 만들어봄

'파일에서 저장'으로 시퀀셜 모델 저장, 머신러닝 단계 정리: 문제설정, 데이터수집, 데이터관찰, 모델설정, 학습, 테스트, 평가, 배포.

데이터 수집, 관찰, 정제부분은 비쥬얼라이즈에 해당, 모델설정과 학습은 얼리딕션이라고 함.


댓글 쓰기

0 댓글