๋ฌธ์ : gre, gpa, rank๋ฅผ ๋ฐํ์ผ๋ก admit์ ์์ธกํ์.
- keras : tensorflow ์์ ์๋ ์ ์ฉํ ๋๊ตฌ. ์ผ๋ผ์ค๋ ์ ์ ๊ฐ ์์ฝ๊ฒ ๋ฅ ๋ฌ๋์ ๊ตฌํํ ์ ์๋๋ก ๋์์ฃผ๋ ์์ ๋ ๋ฒจ์ ์ธํฐํ์ด์ค๋ก ๋ฅ ๋ฌ๋์ ์ฝ๊ฒ ๊ตฌํํ ์ ์๋๋ก ํด์ค.
- optimizer : ๊ฒฝ์ฌํ๊ฐ๋ฒ์์ ๋นผ๋ ๊ฐ์ ์กฐ์ ํด์ค.
๊ธฐ๋ณธ์ ์ผ๋ก๋ adam ์ฌ์ฉํ๋ฉด ๋จ. - loss : ์์คํจ์. ๊ฐ์ ์์ธกํ ๋ ๋ฐ์ดํฐ์ ๋ํ ์์ธก๊ฐ๊ณผ ์ค์ ์ ๊ฐ์ ๋น๊ตํ๋ ํจ์.
ex) binary_crossentropy - ๊ฒฐ๊ณผ๊ฐ 0๊ณผ 1 ์ฌ์ด์ ๋ถ๋ฅ/ํ๋ฅ ๋ฌธ์ ์์ ์ฌ์ฉํ๋ค. - pandas : R์ dataframe์ ์ฐธ๊ณ ํ์ฌ ๋ง๋ ํ์ด์ฌ ํจํค์ง๋ก, ๋ฐ์ดํฐ ๋ถ์์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค.
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๊ฐ ํ์ํ ์ด์ : .csvํ์ผ์ ์ด์ด๋ณด๋ฉด ๊ฐ์ด ๋ค์ด์์ง ์์ ์ ์ด ์๋ค. ํด๋น ์ ์ ๊ฒฝ์ฐ ํ๊ท ๊ฐ์ ๋ฃ๋ ๋ฑ์ ์์ ์ ํตํด ์ฒ๋ฆฌ๋ฅผ ํด์ค์ผ ํ๊ธฐ ๋๋ฌธ์ด๋ค.
- ์ ์ฉํ pandas ํจ์
data.isnull().sum() #๋น ์นธ์ ๋ชจ๋ ์๋ ค์ค๋ผ
data.dropna() #null๊ฐ์ด ํฌํจ๋์ด ์๋ ํ ์ง์ฐ๊ธฐ
data.fillna(100) #๋น ์นธ์ 100์ผ๋ก ๋ค ์ฑ์๋ผ
data['gpa'] #gpa๋ผ๋ ์ด์ ๋ชจ๋ ๋์ดํด๋ผ.
data['gpa'].max() #์ต๋๊ฐ์ ์๋ ค์ค๋ผ. - data.iterrow() : ํ ํ์ฉ ์ถ๋ ฅํ๊ธฐ
import pandas as pd
data = pd.read_csv('/content/sample_data/gpascore.csv')
#๋ฐ์ดํฐ ์ ์ฒ๋ฆฌํ๊ธฐ
#print(data.isnull().sum()) #๋น ์นธ ์ธ๊ธฐ
data = data.dropna() #๋น ์นธ ์์ ์ฃผ๋ ํจ์
y๋ฐ์ดํฐ = data['admit'].values
x๋ฐ์ดํฐ = []
for i, rows in data.iterrows() :
x๋ฐ์ดํฐ.append([rows['gre'], rows['gpa'], rows['rank']])
import numpy as np
import tensorflow as tf
#1. ๋ฅ๋ฌ๋ model ๋์์ธํ๊ธฐ
model = tf.keras.models.Sequential([
#์ค๊ฐ๋ ์ด์ด
tf.keras.layers.Dense(64, activation = 'tanh'),
tf.keras.layers.Dense(128, activation = 'tanh'),
#์ต์ข
๋ ์ด์ด #์ต์ข
๊ฒฐ๊ณผ๋ฅผ 0~1 ์ฌ์ด๋ก ๋ฐ์ผ๋ ค๋ฉด sigmoid ํ์ฑ ํจ์ ์ฌ์ฉ.
tf.keras.layers.Dense(1, activation = 'sigmoid'), #๋ง์ง๋ง ๋ ์ด์ด๋ ๊ฒฐ๊ณผ๊ฐ 1๊ฐ์ด๋๊น ๋
ธ๋ 1๊ฐ.
])
#2. model compile ํ๊ธฐ
model.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
#3. model ํ์ต(fit) ์ํค๊ธฐ (ํธ๋ ์ด๋ ๋ฐ์ดํฐ, ์ค์ ์ ๋ต, epochs)
model.fit( np.array(x๋ฐ์ดํฐ), np.array(y๋ฐ์ดํฐ), epochs = 1000)
#์์ธก
์์ธก๊ฐ = model.predict( [ [7580, 3.70, 3], [400, 2.2, 1] ])
print(์์ธก๊ฐ)
- ์ฒ๋ฆฌ ๊ฒฐ๊ณผEpoch : ๋ค์ด๋ฒ ์์ด ์ฌ์ ์ ๋ป์ผ๋ก๋ ์๋์ด๋ค. ํ๋ จ ๋ฐ์ดํฐ์ ์ ํฌํจ๋ ๋ฐ์ดํฐ๋ค์ด ๋ชจ๋ธ์ ํต๊ณผํ ํ์๋ก, ๋ชจ๋ ํ์ต ๋ฐ์ดํฐ์ ์ ํ์ตํ๋ ํ์๋ฅผ ์๋ฏธํ๋ค.
- loss : ์ค์ฐจ์จ๋ก loss๊ฐ์ด ์ ์ ์์์ง๋ค๋ฉด ์ ์ํ๋๊ณ ์๋ ์ค์ด๋ค.
- accuarcy : ์ ํ๋. ์ ์ ๋์์ง๋ค๋ฉด ์ ์ํ๋๊ณ ์๋ ์ค์ด๋ค.
'๐ฅ ๊ธฐ์ > ์ธ๊ณต์ง๋ฅ ๋ฐ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค(AI, ์ปดํจํฐ ๋น์ , ๋ฅ๋ฌ๋)' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[AI ์คํฐ๋]-3 Project 2 : ์ด๋ฏธ์ง ํ์ต๊ณผ CNN (0) | 2022.06.07 |
---|---|
[AI ์คํฐ๋]-1 ๋ฅ๋ฌ๋ ์ด๋ก (3) (0) | 2022.06.06 |
[AI ์คํฐ๋]-1 ๋ฅ๋ฌ๋ ์ด๋ก (2) (0) | 2022.06.06 |