犯二青年博客
  • 首页
  • 后端技术
  • 前端技术
  • 其他文章
  • 留言板
  • 友链
  • 关于

Ubuntu服务器安装Chrome和ChromeDriver

犯二青年 发布于 2023-05-30

  • 📒 后端技术
  • 📒 Chrome
  • 📒 Ubuntu
  • 📒 ChromeDP
  • 📒 ChromeDriver
  • 🏷️ 后端技术
  • 🏷️ Ubuntu
  • 🏷️ Chrome
  • 🏷️ ChromeDP
  • 🏷️ ChromeDriver

前言

在我们需要爬取一些带有简单反扒的网页时,通常直接使用 HTTP 的 GET 请求是无法获取到完整的 DOM 的,网页内筒大多是通过 JavaScript 进行后置渲染的,我们使用 HTTP 的 GET 请求获取到的只是一个容器,这时候我们需要爬取网页内容,就需要用到浏览器了,这里给大家介绍如何在服务器上安装 Chrome,并且使用 chromedp 简单调用 Chrome

安装 Chrome 浏览器

SSH连接到服务器

下载 Chrome 浏览器

1
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb

安装下载的 Chrome 安装部

1
sudo dpkg -i google-chrome-stable_current_amd64.deb

安装相关缺少的依赖

1
sudo apt-get install -f

验证安装是否成功

1
google-chrome-stable

安装 ChromeDriver

安装 ChromeDriver 所需依赖

1
2
sudo apt-get update
sudo apt-get install -y unzip xvfb libxi6 libgconf-2-4

下载 ChromeDriver 最新版本

1
2
CHROME_DRIVER_VERSION=$(curl -sS chromedriver.storage.googleapis.com/LATEST_RELEASE)
wget -N https://chromedriver.storage.googleapis.com/$CHROME_DRIVER_VERSION/chromedriver_linux64.zip

解压并设置可执行权限

1
2
unzip chromedriver_linux64.zip
chmod +x chromedriver

移动到环境变量中

1
sudo mv chromedriver /usr/local/bin/

使用 ChromeDP 简单调用 Chrome

在你的Go代码中,使用chromedp之前,设置Chrome可执行文件的路径,示例如下:

1
2
3
4
5
6
// 其实不设定也可以,因为我们已经将 Chrome 添加到了 Ubuntu 的环境变量中去了
chromePath := "/usr/bin/google-chrome-stable"
chromedp.ExecAllocatorOptions(
chromedp.ExecPath(chromePath),
chromedp.Flag("headless", true),
)

结语

到此,Chrome和ChromeDriver就已经安装完毕了,将使用 ChromeDP 来爬取网页信息的爬虫打包好,放在服务器上就可以直接执行了。

后续我还会出一篇如何使用 golang 编写爬虫程序,分别介绍有反扒机制和无反扒机制的爬取方法。

hyperf使用Xdebug调试断点

上一篇

EFK实践(三) - 使用Filebeat采集日志

下一篇
犯二青年

犯二青年

一个平淡的开发者~

62
17
60
TOC
  1. 1. 前言
  2. 2. 安装 Chrome 浏览器
    1. 2.1. 下载 Chrome 浏览器
    2. 2.2. 安装下载的 Chrome 安装部
    3. 2.3. 安装相关缺少的依赖
    4. 2.4. 验证安装是否成功
  3. 3. 安装 ChromeDriver
    1. 3.1. 安装 ChromeDriver 所需依赖
    2. 3.2. 下载 ChromeDriver 最新版本
    3. 3.3. 解压并设置可执行权限
    4. 3.4. 移动到环境变量中
    5. 3.5. 使用 ChromeDP 简单调用 Chrome
  4. 4. 结语
NOTICE

保持好奇,刻意练习,每日精进!

CATEGORYS
  • 后端技术 (57)
  • ElasticSearch Dump (1)
  • 踩坑日记 (1)
  • ElasticSearch (1)
  • 前端技术 (2)
  • 其他文章 (3)
  • EFK (3)
  • ElasticSearch (3)
  • 开发小技巧 (1)
  • 微服务 (1)
  • 对称加密 (1)
  • gRPC (1)
  • 薅羊毛 (1)
  • Chrome (1)
  • Ubuntu (1)
  • ChromeDP (1)
  • ChromeDriver (1)
TAGS
API签名 Centos Charles Chrome ChromeDP ChromeDriver Deepin Docker Docker Desktop ElasticSearch ElasticSearch Dump Elasticsearch Filebeat Git Github Actions Golang Hyperf JavaScript Jenkins Kibana Laravel Linux Mac MySQL PHP PhpStorm Redis SSH Swoole Ubuntu Vue Windows Xdebug deploy gRPC git github hyperf k8s k8s教程系列 mysqldump oh-my-zsh passport php-cs-fixer sql supervisord web逆向 zsh 其他 后端技术 并发编程 开发小技巧 微服务 数据库备份 数据库迁移 数据迁移 生活小技巧 编程感悟 薅羊毛 运维技巧

© 2024 犯二青年

琼ICP备2024048013号-1

Powered by 犯二青年 托管于 GitHub & 七牛云

本站总访问量次 | 本站访客数人

🌞 浅色 🌛 深色 🤖️ 自动