discover customer mailboxes script

如何批量发掘客户邮箱

不管做 B2B 还是 B2C,亦或是在线营销,和老外交流首先第一步就是获取到他/她的邮箱,才能进行后续的交流。

获取邮箱的通常做法,是通过浏览目标网站发现网站上的邮箱,再进行邮件沟通;厉害一点的做法就是借助第三方工具去发现目标用户的邮箱,省去人工找的过程。这样的工具主要有:

  • Buzzmarker:一款谷歌浏览器插件,可以检查社交,姓名,Contact 资料来获取邮箱。
  • Email Hunter:一款谷歌浏览器插件,只要输入域名就可以找到潜在的邮箱地址。

但是如果你有 10000 个客户线索呢?

OK,你体力很好,一个一个找吧,可能一个星期就处理完了。

十万个呢?

所以这里贴一份我前段时间写的 Python 脚本,利用技术去批量发掘用户的邮箱。直接将网址整理成一个 TXT 文档,启动脚本即可,一上午五千个邮箱不是难事。

discover customer mailboxes script
Python 批量发掘脚本

贴下具体的代码,要是有不明白的可以底下留言或者邮件联系。

# 从配置文件中读取网址信息  
def parse_text():  
    with open('./site.txt', 'r', encoding='utf-8') as f:  
        site_list = []  
        site_data = f.readlines()  
        # 排除特定字符网址  
        exclude_site = ['etsy.', 'youtube.', 'youtu.be', 'amzn.to.', 'amazon.', 'tiktok.', 'facebook.', 'gmail.', 'wa.me']  
        for item in site_data:  
            site = item.strip('\n')  
            flag = True  
            for exclude in exclude_site:  
                if exclude in site:  
                    flag = False  
                    break            if flag:  
                if site not in site_list:  
                    site_list.append(site)  
    return site_list
# 解析网页寻找其中的邮件信息  
def find_contact(link):  
    suffix_list = ['/', '/contact', '/contact-us', '/pages/contact', '/pages/contact-us', '/contactus', '/contacts',  
                   '/get-in-touch', '/contact.html', '/contact-form', '/contact-4', '/connect', '/about', '/about-us',  
                   '/pages/about', '/pages/about-us', '/pages/our-story', '/pages/location', '/pages/locate']  
    site_result = []  
    result = [link, '', '']  
    try:  
        for suffix in suffix_list:  
            url = 'http://' + link + suffix  
            res = requests.get(url, headers=HEADERS, proxies=PROXIES)  
            if res.status_code == 200:  
                email_set = find_email(res.text)  
                email_list = list(email_set)  
                if len(email_list) > 0:  
                    result[1] = url  
                    if len(email_list) == 1:  
                        result[2] = email_list[0]  
                    else:  
                        info = ''  
                        for email in email_list:  
                            info = info + email + ' - '  
                        result[2] = info  
                    break  
            time.sleep(1)  
    except Exception as e:  
        result[2] = 'Process Error'  
        print('Process Error')  
    site_result.append(result)  
    # 保存数据  
    if len(site_result) > 0:  
        seller_export_df = pd.DataFrame(site_result)  
        seller_export_df.to_csv('C:\\Users\\Administrator\\Desktop\\res.csv', mode='a', header=False, index=False)  
        print('导出完成')

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部