Data/Ai

머신러닝의 개념과 동작 방식 - 벡터와 특징 추출

재은초 2023. 6. 18. 12:31
반응형

머신 러닝(Machine Learning)이란?

  • 기계 학습(機械學習) 또는 머신 러닝(Machine Learning)은 인공 지능의 한 분야로, 컴퓨터가 스스로 학습할 수 있도록 도와주는 알고리즘과 기술을 개발하는 분야다.
  • 머신러닝은 사람이 일일이 구현하기에는 너무 많은 양의 데이터를 처리할 때 사용할 수 있도록 고안된 방법으로, 컴퓨터를 인간처럼 학습시킴으로써 인간의 도움 없이 컴퓨터 스스로 작업한다.

https://strongai.tistory.com/3

 

머신러닝의 동작 방식

  • 머신러닝에서는 양질의 데이터가 매우 중요한 역할을 하며 양질의 데이터를 많이 보유할수록 보다 높은 성능을 이끌어낼 수 있다.
    1. 일정량 이상의 샘플 데이터를 입력한다.
    2. 입력받은 데이터를 분석하여 일정한 패턴과 규칙을 찾아낸다.
    3. 찾아낸 패턴과 규칙을 가지고 스스로 학습한 후에 이를 기반으로 예측 및 의사결정 등을 수행한다.

벡터(Vector)와 특징량

http://www.tcpschool.com/deep2018/deep2018_machine_learning

  • 벡터란 공간에서 크기와 방향을 가지는 것을 의미하며, 위의 그림에서는 별모양과 원모양 점들이 벡터다.
  • 특정 벡터들이 모여 있는 것을 특징량이라고 부르며, 머신러닝에서는 바로 이 특징량을 바탕으로 벡터들을 서로 구분한다.
벡터(Vector)란?
위치, 속도, 힘 등과 같이 크기와 방향성을 갖는 물리량을 나타내는데 사용하는 기하학적 대상으로, 벡터에 대해 정의된 각종 연산법이 정의되는 공간인 벡터 공간(Vector Space)의 원소다.


특징추출(Feature Extraction)

  • 특징추출이란 사람이 인지하는 데이터를 컴퓨터가 인지할 수 있는 데이터로 변환해 주는 과정에서 데이터별로 어떤 특징을 가지고 있는지를 찾고 그것을 토대로 데이터를 벡터로 변환하는 작업을 말한다.
  • 원하는 특징을 자동으로 추출해주는 기능은 없기에, 여러 특징 중에서 어떤 특징을 추출할지를 개발자가 결정하며 이것이 바로 머신러닝 개발의 핵심이다. 예를 들어 학습 기계에 장미꽃을 학습시킨다면, 장미꽃의 색상, 꽃잎 수, 모양 등의 특징 중에서 어떤 특징을 사용할 것인지를 결정해야 하며 그것을 벡터로 변환해야 머신러닝을 수행할 수 있다.

 

Reference

반응형