如何批量发掘客户邮箱

不管做 B2B 还是 B2C，亦或是在线营销，和老外交流首先第一步就是获取到他/她的邮箱，才能进行后续的交流。

获取邮箱的通常做法，是通过浏览目标网站发现网站上的邮箱，再进行邮件沟通；厉害一点的做法就是借助第三方工具去发现目标用户的邮箱，省去人工找的过程。这样的工具主要有：

Buzzmarker：一款谷歌浏览器插件，可以检查社交，姓名，Contact 资料来获取邮箱。
Email Hunter：一款谷歌浏览器插件，只要输入域名就可以找到潜在的邮箱地址。

但是如果你有 10000 个客户线索呢？

OK，你体力很好，一个一个找吧，可能一个星期就处理完了。

十万个呢？

所以这里贴一份我前段时间写的 Python 脚本，利用技术去批量发掘用户的邮箱。直接将网址整理成一个 TXT 文档，启动脚本即可，一上午五千个邮箱不是难事。

discover customer mailboxes script — Python 批量发掘脚本

贴下具体的代码，要是有不明白的可以底下留言或者邮件联系。

# 从配置文件中读取网址信息  
def parse_text():  
    with open('./site.txt', 'r', encoding='utf-8') as f:  
        site_list = []  
        site_data = f.readlines()  
        # 排除特定字符网址  
        exclude_site = ['etsy.', 'youtube.', 'youtu.be', 'amzn.to.', 'amazon.', 'tiktok.', 'facebook.', 'gmail.', 'wa.me']  
        for item in site_data:  
            site = item.strip('\n')  
            flag = True  
            for exclude in exclude_site:  
                if exclude in site:  
                    flag = False  
                    break            if flag:  
                if site not in site_list:  
                    site_list.append(site)  
    return site_list

# 解析网页寻找其中的邮件信息  
def find_contact(link):  
    suffix_list = ['/', '/contact', '/contact-us', '/pages/contact', '/pages/contact-us', '/contactus', '/contacts',  
                   '/get-in-touch', '/contact.html', '/contact-form', '/contact-4', '/connect', '/about', '/about-us',  
                   '/pages/about', '/pages/about-us', '/pages/our-story', '/pages/location', '/pages/locate']  
    site_result = []  
    result = [link, '', '']  
    try:  
        for suffix in suffix_list:  
            url = 'http://' + link + suffix  
            res = requests.get(url, headers=HEADERS, proxies=PROXIES)  
            if res.status_code == 200:  
                email_set = find_email(res.text)  
                email_list = list(email_set)  
                if len(email_list) > 0:  
                    result[1] = url  
                    if len(email_list) == 1:  
                        result[2] = email_list[0]  
                    else:  
                        info = ''  
                        for email in email_list:  
                            info = info + email + ' - '  
                        result[2] = info  
                    break  
            time.sleep(1)  
    except Exception as e:  
        result[2] = 'Process Error'  
        print('Process Error')  
    site_result.append(result)  
    # 保存数据  
    if len(site_result) > 0:  
        seller_export_df = pd.DataFrame(site_result)  
        seller_export_df.to_csv('C:\\Users\\Administrator\\Desktop\\res.csv', mode='a', header=False, index=False)  
        print('导出完成')

关于小渔

Yves Yu