Ã¥¼Ò°³
óÀ½ ¹è¿ì´Â »ç¶÷µµ, ¹Ù·Î µû¶ó Çϸç ÀÍÈ÷´Â ÆÄÀ̽㠵¥ÀÌÅÍ ºÐ¼® ÀÔ¹®¼
¡ºÃ³À½À̾ß, ÆÄÀ̽㠵¥ÀÌÅÍ ºÐ¼®¡»Àº ÆÄÀ̽ãÀ» óÀ½ Á¢ÇÏ´Â »ç¶÷µµ ¹Ù·Î ½Ç½ÀÇÒ ¼ö ÀÖµµ·Ï ±¸¼ºµÈ µ¥ÀÌÅÍ ºÐ¼® ÀÔ¹®¼ÀÔ´Ï´Ù. º¹ÀâÇÑ À̷к¸´Ù´Â ±¸±Û ÄÚ·¦ ȯ°æÀ» Ȱ¿ëÇÑ ½Ç½À Á᫐ ±¸¼ºÀ¸·Î, NumPy¿Í Pandas¸¦ Ȱ¿ëÇÑ ¹è¿ °è»ê, µ¥ÀÌÅÍ Àüó¸®, Åë°è ¿ä¾à, °íÀµ°ª ºÐ¼® µîÀÇ ±â´ÉÀ» ÇϳªÇϳª µû¶ó Çϸç ÀÍÈú ¼ö ÀÖµµ·Ï Â¥ÀÓ»õ ÀÖ°Ô ¼³°èµÇ¾ú½À´Ï´Ù.
ƯÈ÷ ¼³Ä¡ ¾øÀÌ À¥¿¡¼ ½Ç½À °¡´ÉÇÑ ±¸±Û ÄÚ·¦ ȯ°æÀ» ¾È³»ÇÏ¿©, ÇÁ·Î±×·¥ ¼³Ä¡¿¡ ¾î·Á¿òÀ» ´À³¢´Â Ãʺ¸ÀÚµµ ºÎ´ã ¾øÀÌ ½ÃÀÛÇÒ ¼ö ÀÖ½À´Ï´Ù. °¢ À帶´Ù ÁÖ¿ä À̷аú ½Ç½À Äڵ带 ¿¬°áÇϰí, ¿¹Á¦¸¦ ÆÄÀÏ ´ÜÀ§·Î Á¦°øÇϸç, ÀÌÇØ¸¦ µ½´Â ÆÁ°ú ÁÖ¼®À¸·Î ½Ç¹«¿¡ ¹Ù·Î ¿¬°áÇÒ ¼ö ÀÖµµ·Ï µ½½À´Ï´Ù.
µ¥ÀÌÅÍ ºÐ¼®ÀÌ Ã³À½ÀÎ µ¶ÀÚµµ, ¿¢¼¿¸¸ ½á¿À´ø Á÷ÀåÀεµ ÀÌ Ã¥ ÇÑ ±ÇÀ¸·Î ÆÄÀ̽㠱â¹Ý µ¥ÀÌÅÍ ºÐ¼®ÀÇ ÇÙ½É È帧À» ÀÌÇØÇÏ°í ½Ç¹«¿¡ Ȱ¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù.
óÀ½ ½ÃÀÛÇÏ´Â »ç¶÷¿¡°Ô °¡Àå Ä£ÀýÇÑ µ¥ÀÌÅÍ ºÐ¼® ±æÀâÀÌ, ¹Ù·Î ÀÌ Ã¥ÀÔ´Ï´Ù.
[ÀÌ Ã¥ÀÇ Æ¯Â¡]
ºñ°³¹ßÀÚÀÇ ½Ã¼±¿¡¼ ½ÃÀÛÇÏ´Â µ¥ÀÌÅÍ ºÐ¼® ÀÔ¹®¼
º¹ÀâÇÑ ¿ë¾î³ª ÀÌ·Ð Á᫐ ¼³¸íÀÌ ¾Æ´Ñ, ½Ç¹« Áß½ÉÀÇ ¹®Á¦ ÇØ°á°ú ¾÷¹« È帧 ÀÌÇØ¸¦ ¹ÙÅÁÀ¸·Î ÆÄÀ̽㠺м®À» ½±°í Çö½Ç°¨ ÀÖ°Ô ¼Ò°³ÇÕ´Ï´Ù.
±¸±Û ÄÚ·¦À» ±â¹ÝÀ¸·Î ÇÑ ¼³Ä¡ ¾ø´Â ½Ç½À ȯ°æ Á¦°ø
Ãʺ¸ÀÚµµ ȯ°æ ¼³Á¤¿¡ ºÎ´ã ¾øÀÌ ½ÃÀÛÇÒ ¼ö ÀÖµµ·Ï Ŭ¶ó¿ìµå ½Ç½À ȯ°æ(Colab)À» Áß½ÉÀ¸·Î ±¸¼ºÇØ Á¢±Ù¼ºÀ» ³ô¿´½À´Ï´Ù.
´Ü°èº° ½Ç½À ¹®Á¦¿Í ÄÚµå ÆÄÀÏ Á¦°ø
°¢ À帶´Ù ½Ç½À ¹®Á¦¿Í ÇØ¼³ Äڵ带 Á¦°øÇÏ¿© ÇнÀ ¼º°ú¸¦ Á¡°ËÇϰí, ½Ç¹«¿¡ ÇÊ¿äÇÑ ÀÀ¿ë·ÂÀ» Ű¿ï ¼ö ÀÖ½À´Ï´Ù.
µ¿¿µ»ó °ÀÇ¿Í ¿¬µ¿µÈ ÇнÀ Áö¿ø
¸ðµç ½Ç½À Äڵ带 µ¿¿µ»óÀ¸·Î µû¶ó Çϸç ÇнÀÇÒ ¼ö ÀÖµµ·Ï ±¸¼ºµÇ¾î ÀÖ¾î, µ¶ÇÐÀÌ ¾î·Á¿î ºÐµéµµ ´«À¸·Î º¸°í ¼ÕÀ¸·Î ÀÍÈú ¼ö ÀÖ½À´Ï´Ù.
¸ñÂ÷
1Àå µ¥ÀÌÅÍ ºÐ¼® ½ÃÀÛÇϱâ
1.1 µ¥ÀÌÅÍ ºÐ¼®
1.2 °³¹ß ȯ°æ ±¸Ãà(±¸±Û ÄÚ·¦)
±¸±Û ÄÚ·¦ °³¿ä
±¸±Û ÄÚ·¦ ÁÖ¿ä Æ¯Â¡
±¸±Û ÄÚ·¦ ½ÃÀÛ
±¸±Û ÄÚ·¦ ȯ°æ¼³Á¤
µ¥ÀÌÅÍ ºÒ·¯¿À±â
ÄÚµå ÀÛ¼º ¹× ½ÇÇà
±úÁü ¿À·ù ÇØ°á
¸¶¹«¸® ½Ç½À¹®Á¦
¸¶¹«¸® ½Ç½À¹®Á¦ Á¤´ä
2Àå NumPy
2.1 NumPy °³¿ä
NumPy °³³ä
NumPy Ư¡
NumPy È®ÀÎ
NumPy¿Í ¸®½ºÆ®ÀÇ Â÷ÀÌÁ¡
2.2 ¹è¿ »ý¼º
np.array( ) ÇÔ¼ö
np.zeros( ) ÇÔ¼ö
np.ones( ) ÇÔ¼ö
np.full( ) ÇÔ¼ö
np.empty( ) ÇÔ¼ö
np.arange( ) ÇÔ¼ö
np.linspace( ) ÇÔ¼ö
2.3 ¹è¿ÀÇ ÁÖ¿ä ¼Ó¼º
shape ¼Ó¼º
dtype ¼Ó¼º
size ¼Ó¼º
ndim ¼Ó¼º
flat ¼Ó¼º
2.4 ¹è¿ÀÇ µ¥ÀÌÅÍ Å¸ÀÔ
±âº» µ¥ÀÌÅÍ Å¸ÀÔ
µ¥ÀÌÅÍ Å¸ÀÔ º¯È¯ - astype( ) ÇÔ¼ö
2.5 ¹è¿ÀÇ À妽Ì
±âº» À妽Ì
´ÙÂ÷¿ø ¹è¿ À妽Ì
À½¼ö À妽Ì
´ÙÂ÷¿ø ¹è¿¿¡¼ÀÇ À½¼ö À妽Ì
Boolean À妽Ì
ÆÒ½Ã À妽Ì
´ÙÁß ÆÒ½Ã À妽Ì
2.6 ¹è¿ÀÇ ½½¶óÀ̽Ì
±âº» ½½¶óÀ̽Ì
´ÙÂ÷¿ø ¹è¿ ½½¶óÀ̽Ì
½½¶óÀ̽ÌÀ» ÀÌ¿ëÇÑ Çà/¿ ¼±ÅÃ
À½¼ö ½½¶óÀ̽Ì
Boolean ¹è¿À» »ç¿ëÇÑ ½½¶óÀ̽Ì
¹è¿À» »ç¿ëÇÑ ½½¶óÀ̽Ì
2.7 ¹è¿ÀÇ ¿¬»ê
»ê¼ú ¿¬»ê
Áö¼ö ¿¬»ê
¹è¿ÀÇ ºñ±³ ¿¬»ê
¹è¿°ú ½ºÄ®¶ó ¿¬»ê
³í¸® ¿¬»ê
Á¦°ö±Ù
2.8 ¹è¿ ºñ±³
¿ä¼Òº° ºñ±³
¹è¿ °£ ºñ±³
np.all( )
np.any( )
np.array_equal( )
2.9 ¹è¿ º´ÇÕ
2.10 ¹è¿ Á¤·Ä
1Â÷¿ø ¹è¿ Á¤·Ä
´ÙÂ÷¿ø ¹è¿ Á¤·Ä
³»¸²Â÷¼ø Á¤·Ä
¿øº» ¹è¿ Á¤·Ä - ndarray.sort( )
´ÙÁß Á¶°Ç Á¤·Ä - np.lexsort( )
2.11 ¹è¿ ÇÊÅ͸µ
±âº» ÇÊÅ͸µ
´ÙÂ÷¿ø ¹è¿ ÇÊÅ͸µ
np.where( )¸¦ »ç¿ëÇÑ ÇÊÅ͸µ
¸¶½ºÅ© ¹è¿À» ÀÌ¿ëÇÑ ÇÊÅ͸µ - ma.array( )
º¹ÇÕ Á¶°ÇÀ» »ç¿ëÇÑ ÇÊÅ͸µ
np.extract( )¸¦ »ç¿ëÇÑ Á¶°Ç ±â¹Ý ÃßÃâ
2.12 ¹è¿ÀÇ Åë°è
ÃÖ¼Ú°ª - np.min( )
ÃÖ´ñ°ª - np.max( )
µ¥ÀÌÅÍ ¹üÀ§ - np.ptp( )
ÇÕ°è(Sum) - np.sum( )
Æò±Õ(Mean) - np.mean( )
ÁßÀ§¼ö(Median) - np.median( )
ºÐ»ê(Variance) - np.var( )
Ç¥ÁØÆíÂ÷(Standard Deviation) - np.std( )
»çºÐÀ§¼ö(Quantiles) - np.percentile( )
¸¶¹«¸® ½Ç½À¹®Á¦
¸¶¹«¸® ½Ç½À¹®Á¦ Á¤´ä
3Àå Pandas
3.1 Pandas °³¿ä
Pandas °³³ä
Pandas Ư¡
Pandas È®ÀÎ
NumPy¿Í Pandas
3.2 Series
Series °³³ä
Series Ư¡
Series¿Í ¸®½ºÆ®ÀÇ Â÷ÀÌÁ¡
Series »ý¼º ¹æ¹ý
Series ±¸Á¶ È®ÀÎ
µ¥ÀÌÅÍ Á¶È¸
Àε¦½Ì ¹× ½½¶óÀ̽Ì
µ¥ÀÌÅÍ Ãß°¡
Series °ª ¼öÁ¤
À妽º À̸§ º¯°æ - rename( )
µ¥ÀÌÅÍ Åë°è ¹× ¿ä¾à
°íÀµ°ª È®ÀÎ
µ¥ÀÌÅÍ ÇÊÅ͸µ ¹× Á¶°Ç ¼±ÅÃ
SeriesÀÇ µ¥ÀÌÅÍ ¿¬°á - concat( )
µ¥ÀÌÅÍ Á¤·Ä
µ¥ÀÌÅÍ ±×·ìÈ ¹× Áý°è
3.3 DataFrame
DataFrame °³³ä
DataFrame°ú ¸®½ºÆ®ÀÇ Â÷ÀÌÁ¡
DataFrame »ý¼º ¹æ¹ý
DataFrame ±¸Á¶ È®ÀÎ
µ¥ÀÌÅÍ Á¶È¸
Àε¦½Ì ¹× ½½¶óÀ̽Ì
µ¥ÀÌÅÍ Ãß°¡
DataFrame °ª ¼öÁ¤
¿ À̸§ º¯°æ
µ¥ÀÌÅÍ Åë°è ¹× ¿ä¾à
°íÀµ°ª È®ÀÎ
µ¥ÀÌÅÍ ÇÊÅ͸µ ¹× Á¶°Ç ¼±Åà - ´ÙÁß Á¶°Ç ÇÊÅ͸µ
µ¥ÀÌÅÍ º´ÇÕ ¹× °áÇÕ
µ¥ÀÌÅÍ Á¤·Ä
µ¥ÀÌÅÍ ±×·ìÈ ¹× Áý°è
3.4 Series¿Í DataFrame
Series¿Í DataFrameÀÇ Â÷ÀÌÁ¡
¸¶¹«¸® ½Ç½À¹®Á¦
¸¶¹«¸® ½Ç½À¹®Á¦ Á¤´ä
4Àå matplotlib
4.1 matplotlib °³¿ä
matplotlib °³³ä
matplotlib ¼³Ä¡
4.2 matplotlib ±â´É
Ç÷Ô(Plot)
¼± ±×·¡ÇÁ(Line Plot)
¸·´ë ±×·¡ÇÁ(Bar Chart)
ÆÄÀÌ Â÷Æ®(Pie Chart)
»êÁ¡µµ(Scatter Plot)
È÷½ºÅä±×·¥(Histogram)
¼ºêÇ÷Ô(subplot)
ÇÃ·Ô À̹ÌÁö
4.3 seaborn °³¿ä ¹× ±â´É
seaborn °³³ä
seaborn ¼³Ä¡
È÷Æ®¸Ê(Heatmap)
Ŭ·¯½ºÅ͸Ê(Clustermap)
¹Ú½ºÇ÷Ô(Boxplot)
Ä«¿îÆ®Ç÷Ô(Countplot)
¸¶¹«¸® ½Ç½À¹®Á¦
¸¶¹«¸® ½Ç½À¹®Á¦ Á¤´ä
5Àå µ¥ÀÌÅÍ Àüó¸®
5.1 µ¥ÀÌÅÍ Áغñ ¹× ºÒ·¯¿À±â
CSV ÆÄÀÏ ºÒ·¯¿À±â
¿¢¼¿ ÆÄÀÏ ºÒ·¯¿À±â
JSON ÆÄÀÏ ºÒ·¯¿À±â
5.2 µ¥ÀÌÅÍ Å½»ö
µ¥ÀÌÅÍ ±¸Á¶ ÀÌÇØ
Åë°èÀû ¿ä¾à
5.3 µ¥ÀÌÅÍ Àüó¸®
µ¥ÀÌÅÍ °áÃø°ª ó¸®
Áߺ¹ µ¥ÀÌÅÍ Á¦°Å
5.4 µ¥ÀÌÅÍ º¯È¯
µ¥ÀÌÅÍ Çü½Ä º¯È¯
¹üÁÖÇü µ¥ÀÌÅÍ ÀÎÄÚµù
µ¥ÀÌÅÍ Á¤±ÔÈ ¹× Ç¥ÁØÈ
µ¥ÀÌÅÍ À妽Ì
µ¥ÀÌÅÍ ½½¶óÀ̽Ì
µ¥ÀÌÅÍ Á¤·Ä
5.5 µ¥ÀÌÅÍ ÀúÀå
CSV Çü½ÄÀ¸·Î ÀúÀå
Excel Çü½ÄÀ¸·Î ÀúÀå
JSON Çü½ÄÀ¸·Î ÀúÀå
¸¶¹«¸® ½Ç½À¹®Á¦
¸¶¹«¸® ½Ç½À¹®Á¦ Á¤´ä
6Àå µ¥ÀÌÅÍ ºÐ¼®
6.1 ¸¶ÄÉÆÃ ¹× °í°´ ºÐ¼®
6.2 ±ÝÀ¶ ¹× ¸®½ºÅ© °ü¸®
6.3 ÀÇ·á ¹× ÇコÄɾî
6.4 Á¦Á¶ ¹× ǰÁú°ü¸®
6.5 °ø°ø Á¤Ã¥ ¹× »çȸ ¹®Á¦ ÇØ°á
7Àå ÄɱÛ(kaggle) ½Ç½À
7.1 ÄɱÛ(kaggle) °³¿ä
ÄÉ±Û °³³ä
ÄÉ±Û Æ¯Â¡
ÄÉ±Û Áغñ
7.2 ÄÉ±Û ½Ç½À
ŸÀÌŸ´Ð »ýÁ¸ÀÚ ¿¹Ãø ¹®Á¦(Titanic - Machine Learning from Disaster)
ÁÖÅà °¡°Ý ¿¹Ãø ¹®Á¦(House Prices - Advanced Regression Techniques)
½Å¿ëÄ«µå »ç±â ŽÁö ¹®Á¦(Credit Card Fraud Detection)
8Àå °ø°øµ¥ÀÌÅÍ ½Ç½À
8.1 °ø°øµ¥ÀÌÅÍ °³¿ä
°ø°øµ¥ÀÌÅÍ °³³ä
°ø°øµ¥ÀÌÅÍ Æ¯Â¡
8.2 °ø°øµ¥ÀÌÅÍ ½Ç½À
´ë±â¿À¿° µ¥ÀÌÅÍ ºÐ¼®
¼¿ï½Ã ÀÚÀü°Å ´ë¿© µ¥ÀÌÅÍ ºÐ¼®
Áö¿ªº° Àα¸Åë°è µ¥ÀÌÅÍ ºÐ¼®
º°Ã¥ºÎ·Ï ÇÙ½É³ëÆ®
ÇÙ½É Çʱâ³ëÆ®
ÇÙ½É ¿ë¾î³ëÆ®