J’ai un code qui me donne des données de recherche YouTube telles que : titre, titre de la chaîne et description. Cette information stockée dans Pandas et maintenant je me bats en essayant d’ajouter +1 colonne qui affichera les e-mails validés de la colonne Description
(En fait, j’essaie de copier la colonne Description et de la filtrer avec REGEX généré)
Partie du script qui analyse les données pour moi
ids = [item['id']['videoId'] for item in res['items']]
results = youtube.videos().list(id=ids, part="snippet").execute()
for result in results.get('items', []):
print(result ['id'])
print(result ['snippet']['channelTitle'])
print(result ['snippet']['title'])
print(result ['snippet']['description'])
Validation d’expression régulière pour la description
input = (result ['snippet']['description'])
def useRegex(input):
pattern = re.compile(r"([a-zA-Z]+( [a-zA-Z]+)+):.*[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?", re.IGNORECASE)
return pattern.match(input)
Une partie du code Pandas
data = {'Channel Title': [result['snippet']['channelTitle'] for result in results['items']],
'Title': [result['snippet']['title'] for result in results['items']],
'Description': [result['snippet']['description'] for result in results['items']]
}
df = pd.DataFrame(data,
columns = ['Channel Title', 'Title', 'Description'],
)
df.head()