이번에는 최근 빅데이터 해석 및 예측을 위한 도구로 각광받고 있는 머신러닝(또는 기계학습)에 대하여 소개하고자 합니다.
아울러, 이펙트몰 서비스에서 이것을 어떻게 활용하고 있는지 알려드리겠습니다.
머신러닝은 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 것을 말합니다.
기존에는 컴퓨터가 입력값을 받으면 결과값을 출력하는 방식으로 프로그램을 구성하였다면 인공지능은 기존의 입력값과
결과값을 가지고 컴퓨터가 학습을 통하여 데이터셋의 경향성 및 유의성을 파악한 다음 새로운 데이터셋이 주어졌을 때 결과를 예측할 수 있도록 합니다.
컴퓨터 학습을 위한 방법으로는 주로 통계적 방법을 활용하며, 이를 통하여 데이터에서 법칙성을 추출하고 새로운 정보에 대하여 결과를 예측, 분류 합니다.
예전에는 부족한 데이터와 컴퓨터 성능으로 인하여 머신러닝이 크게 활용되지 못했지만, 최근에는 정보통신의 발달로 인하여
급격한 데이터양 증가와 함께 컴퓨터 성능의 비약적인 발달이 이루어져 머신러닝이 크게 각광받고 있습니다.
이에 따라서, 머신러닝은 이미지 식별, 자연어 처리, 주식예측, 음성인식 및 질병 진단 등 다양한 분야에 활용될 수 있게 되었습니다.
그렇다면 컴퓨터가 어떻게 학습을 하는지 간단한 예를 들어 보도록 하겠습니다.
중학교 수준의 수학교육을 받은 사람은 x와 y 사이에 약 2배의 관계가 있을 것이라고 생각할 수 있습니다.
따라서 만약 x값이 7이라면 우리는 y 값이 약 14라고 쉽게 결론을 내릴 수 있습니다.
그렇다면 컴퓨터는 이것을 어떻게 예측을 할까요? 기본적으로 선형회귀라는 방법으로 x와 y사이의 관계를 유추합니다.
선형회귀란 쉽게 말해서 어떤 현상을 그래프 상에서 직선적인 상관관계로 파악하는 것입니다.
사람들은 어떤 현상에 대한 경향성을 파악할 때 우선 직선적인(선형적인) 관계로 파악하는 경우가 많습니다.
이것을 컴퓨터에게도 적용한 것이 선형회귀 입니다.
다음에는 AI가 선형회귀에 의한 결과값 예측을 어떻게 하는지 간단한(?) 수식 소개와 함께 Tensorflow와 Keras로 코딩한 결과를 공유하겠습니다.