OpenAI API의 Playground를 보면 우측에 이러한 옵션이 있는 것을 보실 수 있습니다. Temperature 직역하면 모델의 온도 정도가 되는데, 1에 가까우면 예측 불가능한 랜덤한 단어를 사용하게 됩니다. 예를 들어, '나는 학교가 끝나고 ○○에 갔다' 라는 문장이 주어지면, 0에 가까운 모델은 학원, 집을 생각해 냈다면 1에 가까운 모델은 영화관, 놀이공원, 바다, 노래방 등이 될 수 있습니다. Maximum length 말 그대로 답변 길이를 지정하는 파라미터입니다. 주의해야 할 것은, 답변의 길이가 아닌 답변 토큰의 길이입니다. Top P 단어를 보고, 다음에 올 적절한 단어를 고를 때 상위 P%에 해당하는 단어들만 선택하는 기법입니다. P의 값이 작을수록 다음에 올 단어의 예측 가능..
SVM이란? 서포트 벡터 머신(Support Vector Machine, SVM)은 기계학습의 한 분야로, 입력 데이터에서 단순한 초평면으로 정의 되지 않는 더 복잡한 모델을 만들 수 있도록 확장한 것을 말합니다. 초평면이란, 단순한 평면이 아닌 차원을 뚸어넘는 평면을 말합니다. (예: 3차원에 있는 대각선) 여기 굉장히 분류가 잘 된 SVM이 있습니다. SVM에서는 그림에 있는 점선, 마진의 영역을 최대화 시키는 것이 좋습니다. 하지만 억지로 맞추려고 하는 극단적인 경우에는 아래와 같은 상황이 발생할 수 있습니다. 위의 경우에는 너무 빡빡하게 조건을 잡아서 Overfitting이 발생할 가능성이 높습니다. 반대로 아래의 경우에는 너무 널널하게 잡았기 때문에 Underfitting이 발생할 수 있습니다...
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns !pip install finance-datareader Colab에는 기본적으로 finance-datareader 라이브러리가 설치되어 있지 않기 때문에 수동으로 설치해 주어야 합니다. 리눅스 명령어 앞에 느낌표를 붙여서 명령어를 실행시킬 수 있습니다. %matplotlib inline plt.rcParams["font.family"] = "nanummyeongjo" plt.rcParams["figure.figsize"] = (14, 4) plt.rcParams["lines.linewidth"] = 2 plt.rcParams["axes.g..
import numpy as np import matplotlib.pyplot as plt X = np.random.rand(100) Y = 0.2 * X * 0.5 plt.figure(figsize=(8, 6)) plt.scatter(X, Y) plt.show() X는 무작위로 찍힌 점들, Y는 임의적으로 만들어진 함수입니다. 한번 위 식을 matplotlib을 통해 점을 찍어보면 위와 같이 찍히게 됩니다. def plot_prediction(pred, y) : plt.figure(figsize=(8, 6)) plt.scatter(X, y) plt.scatter(X, pred) plt.show() w = np.random.uniform(-1, 1) b = np.random.uniform(-1, 1) l..