Recap 2# Ce que j'ai lu sur le Deep Learning cette semaine (Documentation, SQL, Conditional Filtering dans Pandas et ChatGPT encore)
Namaste đ
Câest certainement pas le bon jour avec ces fĂȘtes pour partager mes lectures de la semaine mais lâintelligence artificielle nâattend pas.
Avant toute chose, jâai lu le livre dâIdriss Aberkane et jâai notĂ© un truc par rapport Ă mon apprentissage en autodidacte du Deep learning. Ăa ne fait jamais de mal de le rappeler :
Ă quiconque voudrait exceller, je donne le mĂȘme conseil : aussi bien intellectuellement quâĂ©conomiquement, ne jamais rester Ă sa place.
nous avons crĂ©Ă© une grande diversitĂ© de boĂźtes, mentales, culturelles ou physiques, dans lesquelles nous avons pris lâhabitude de nous enfermer systĂ©matiquement. Cet enfermement est une telle condition de notre vie, que bien souvent nous ne pensons pas Ă nous dĂ©finir autrement que par la boĂźte oĂč nous nous sommes rangĂ©s. Car penser dans un schĂ©ma est plus rapide Ă long terme que de penser en dehors, de sorte que le schĂ©ma est Ă la pensĂ©e ce que lâindustrie est Ă lâagriculture : un outil, mais aussi une limitation, une standardisation, un conditionnement et un appauvrissement intrinsĂšque du goĂ»t et de la diversitĂ©, donc de lâadaptabilitĂ©.
The 5 Rules For Good Data Science Project Documentation
Câest basique mais jâavoue que je suis loin dâĂȘtre le meilleur pour correctement documenter un projet.
Ă garder en tĂȘte :
Good Description
A Clear and Concise Installation Guide
Tutorials
Detailed API Reference
Architecture Explanation
Five Ways to do Conditional Filtering in Pandas
Jâadore ce type dâarticle. Ăa ne paie pas de mine mais câest intĂ©ressant parce que je commence Ă manipuler Pandas et ce dire quâon peut filtrer de toutes ces maniĂšres pour une raison, ça mâamuse.
Pandas filtering with selection brackets
Pandas series methods: isin(), between(), contains()
Defining separate filters outside of selection bracket filtering
query()
loc[]
Using the pandas filter() method
The 5 Hardest Things to Do in SQL
Je suis tombé sur cet article et je le garde de cÎté pour quand je creuserai en profondeur SQL. Il parle notamment de
Date Spines
Pivot / Unpivot
One-hot Encoding
Market Basket Analysis
Time-Series Aggregations.
6 Things About Data Science that Employers Donât Want You to Know
Je crois que cet article nâĂ©tait pas le plus intĂ©ressant en revanche jâai notĂ© quelques trucs malgrĂ© tout :
on pense souvent (Ă tort) quâSQL est une compĂ©tence rĂ©servĂ©e aux data analystes. FAUX. En tant que data scientist, on a besoin de donnĂ©es pour crĂ©er des modĂšles d'apprentissage automatique, ce qui signifie quâon doit interroger les donnĂ©es ou crĂ©er des pipelines si les donnĂ©es n'existent pas encore. Et il est extrĂȘmement important de connaĂźtre SQL pour que vos donnĂ©es soient robustes et Ă©volutives.
Les données dans le monde réel sont plus désordonnées que vous ne pouvez l'imaginer. Si vous avez déjà travaillé avec des données sur Kaggle, le monde réel n'a rien à voir
Une grande partie du temps est consacrée à la compréhension du problÚme métier en question. On doit avoir une compréhension complÚte du domaine dans lequel on travaille et du problÚme métier en question. Sans cela, vous passerez à cÎté des relations, hypothÚses et variables clés qui pourraient faire la différence entre un modÚle précis à 65 % et un modÚle précis à 95 %.
10 Examples of Awful Data that I had to work with as a Data Scientist
Rien de bien folichon encore une fois si ce nâest pas faire attention Ă certaines choses :
Quand on peut Ă©crire de diffĂ©rentes maniĂšres comme USA, US ou United States. Il peut ĂȘtre intĂ©ressant dâavoir une table pour indiquer mĂȘme si cette derniĂšre doit ĂȘtre constamment Ă jour⊠:/
Attention au premier jour de la semaine qui diffĂšre selon la culture : lundi ou dimanche ?
Aux typos comme souvent (bien vérifier les mails, adresses, code postal, etc)
Aux donnĂ©es manquantes â ne pas les ignorer !
The List of Top 10 Lists in Data Science
Quelques listes intĂ©ressantesâŠ
Top âïž 10 Skills for Data Science
Probability & Statistics
Linear Algebra
Python
R
SQL
Tableau/Power BI
AWS/Azure
Spark
Excel
DevOps
Top âïž 10 Algorithms for Data Science
Linear Regression
Logistics Regression
K-means Clustering
PCA
Support Vector Machine
Decision Tree
Random Forest
Gradient Boosting Machines
NaĂŻve Bayes Classifier
Artificial Neural Networks
Top âïž 10 Data Science Experts to follow on LinkedIn
Bernard Marr
DJ Patil
Francesca Lazzeri, PhD
Carla Gentry
Dennis R. Mortensen
Andrew Ng
Gregory Piatetsky-Shapiro
Tom Davenport
Randy Lao ïž
NABIH IBRAHIM BAWAZIR
How To Use ChatGPT With Python
Et pour finir ce petit article pour utiliser ChatGPT avec Python en installant OpenAI API client et en récupérant une API key. Son utilisation est assez simple :
# Generate a response
completion = openai.Completion.create(
engine=model_engine,
prompt=prompt,
max_tokens=1024,
n=1,
stop=None,
temperature=0.5,
)
Ce que je trouve intĂ©ressant est lâargument temperature pour customiser le comportement du model. Câest-Ă -dire ajuster la cohĂ©rence des rĂ©ponses. Une tempĂ©rature haute signifie des rĂ©ponses pas trĂšs cohĂ©rentes.