python – Comment filtrer avec des données YouTube analysées par REGEX et les placer dans Pandas Data Frame ?

python – Comment filtrer avec des données YouTube analysées par REGEX et les placer dans Pandas Data Frame ?

J’ai un code qui me donne des données de recherche YouTube telles que : titre, titre de la chaîne et description. Cette information stockée dans Pandas et maintenant je me bats en essayant d’ajouter +1 colonne qui affichera les e-mails validés de la colonne Description

(En fait, j’essaie de copier la colonne Description et de la filtrer avec REGEX généré)

Partie du script qui analyse les données pour moi

ids = [item['id']['videoId'] for item in res['items']]
results = youtube.videos().list(id=ids, part="snippet").execute()
for result in results.get('items', []):
    print(result ['id'])
    print(result ['snippet']['channelTitle'])
    print(result ['snippet']['title'])
    print(result ['snippet']['description'])

Validation d’expression régulière pour la description

input = (result ['snippet']['description'])

def useRegex(input):
    pattern = re.compile(r"([a-zA-Z]+( [a-zA-Z]+)+):.*[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?", re.IGNORECASE)
    return pattern.match(input)

Une partie du code Pandas

data = {'Channel Title': [result['snippet']['channelTitle'] for result in results['items']],
        'Title': [result['snippet']['title'] for result in results['items']],
        'Description': [result['snippet']['description'] for result in results['items']]
       }

df = pd.DataFrame(data,
                  columns = ['Channel Title', 'Title', 'Description'],
                 )
    
df.head()

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.