import numpy as np
import pandas as pd
import re


fruits_df = pd.read_csv('./fruits.txt')
fruits = list(fruits_df['fruit'].values)
fruits_df.head()


fruits_df[fruits_df['fruit'].str.match('^a')]


#[re.search(' ', fruit) is not None for fruit in fruits]
two_word_fruits = []
for fruit in fruits:
    if re.search(' ', fruit):# is not None:
        two_word_fruits.append(fruit)
two_word_fruits


fruits_df[fruits_df['fruit'].str.contains(' ')]


fruits_df[fruits_df['fruit'].str.contains('a')]


fruits_df[fruits_df['fruit'].str.contains('^a')]


fruits_df[fruits_df['fruit'].str.contains('a$')]


fruits_df[
  np.logical_or(
    fruits_df['fruit'].str.startswith('a'),
    fruits_df['fruit'].str.endswith('a')
  )
]


fruits_df[fruits_df['fruit'].str.contains('^a|a$')]


fruits_df[fruits_df['fruit'].str.contains('^[aeiou]')]


fruits_df[fruits_df['fruit'].str.contains('[^aeiounrt]$')]


fruits_df[fruits_df['fruit'].str.contains('[^aeiounrt]{2}$')]
#fruits_df[fruits_df['fruit'].str.contains('[^aeiour]{2, 3}$')]


#fruits_df[fruits_df['fruit'].str.contains('')]


rgx0 = '[aeiou]{2}.[aeiou]{2}'
fruits_df[fruits_df['fruit'].str.contains(rgx0)]


first = True
if first:
    rgx1 = '[aeiou]{2}.+[aeiou]{2}'
    fruits_df[fruits_df['fruit'].str.contains(rgx1)]
else:
    fruits_df[
      np.logical_and(
        fruits_df['fruit'].str.contains(rgx1),
        ~fruits_df['fruit'].str.contains(rgx0)
      )


fruits.append('507@umich.edu')
print(fruits[len(fruits) - 1])

for f in fruits:
    if re.search('\.', f):
        print(f)
    if re.search('[.]', f):
        print('[' + f + ']')


fruits.append(r'C:\path\file.txt')
fruits[len(fruits) - 1]


for f in fruits:
    if re.search(r'\\', f):
        print(f)
    if re.search('\\\\', f):
        print('ugh!')
        print(f)


fruits_df[fruits_df['fruit'].str.contains('\s')]


fruits_df[fruits_df['fruit'].str.contains('(.)\\1')]
#fruits_df[fruits_df['fruit'].str.contains('([^r])\\1')]
#fruits_df[fruits_df['fruit'].str.contains('(.)\\1$')]

Regular Expressions¶

Overview¶

Regular Expressions¶

Imports¶

Example¶

Pandas¶

Search / Contains¶

Search / Contains¶

Regex Concepts - Simple search¶

Regex Concepts - Anchors¶

Regex Concepts - Anchors¶

Anchors in Pandas¶

Regex Concepts - Or¶

Regex Concepts - Bracket Expressions¶

Regex Concepts - Bracket Expressions¶

Regex Concepts - Ranges¶

Regex Concepts - Quantifiers¶

Regex Concepts - Quantifiers¶

Regex Concepts - Wild Card and Quantifiers¶

Regex Concepts - Wild Card Example¶

Regex Concepts - Wild Card with Quantifier Example¶

Escape sequences¶

Escape sequences¶

Escape sequences¶

Character Classes¶

Groups¶

Regex Crosswords¶

Takeaways¶