Zohar的博客
从来|
12
27
爬虫与反爬虫策略 爬虫与反爬虫策略
什么是爬虫爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并将数据抓取下来,然后使用一定的规则提取有价值的数据。说白了就是使用任何技术手段,批量获取网站信息的一种方式。 爬虫是正经爬虫流不流氓我不知道爬虫需要遵守法律,程序员不仅要学
2022-12-27
17
11
14
海量数据取值 海量数据取值
一、如何从大量的 URL 中找出相同的 URL?1. 题目描述给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。请找出 a、b 两个文件共同的 URL。 2. 解答思路1. 分治策略每个 UR
2022-11-14
10
25
过滤器和拦截器 过滤器和拦截器
1. 过滤器(Filter)Servlet 中的过滤器 Filter 实现了 javax.servlet.Filter 接口的服务器端程序,主要用途是设置字符集(CharacterEncodingFilter)、控制权限、控制转向、用户是否
2022-10-25
14
Java命名规范 Java命名规范
java命名规范​ 简洁清爽的代码风格应该是大多数工程师所期待的。在工作中笔者常常因为起名字而纠结,命名已经成为我工作中的拦路虎,夸张点可以说是编程5分钟,命名两小时! ​ 每个公司都有不同的标准,目的是为了保持统一,减少沟通成
2022-10-14
09
28
远程调试 远程调试
远程调试服务端端口配置正常jar包启动设置远程调试端口在启动命令里加入以下jvm参数,其中8082是远程调试端口号-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,addres
2022-09-28
08
29
SpringAop 实战 SpringAop 实战
Spring AOP 实战看了上面这么多的理论知识, 不知道大家有没有觉得枯燥哈. 不过不要急, 俗话说理论是实践的基础, 对 Spring AOP 有了基本的理论认识后, 我们来看一下下面几个具体的例子吧.下面的几个例子是我在工作中所遇见
2022-08-29
28
定时任务详解 定时任务详解
详解Java Quartz Job Scheduling​ Quartz Job Scheduling是基于Java实现的成熟的企业级作业调度组件。笔者最近所做的项目正好用到了Quartz来实现定时任务的调度,在使用过程中对Quart
2022-08-28
17
Linux常用操作命令 Linux常用操作命令
操作系统概述操作系统 Operating System 简称 OS,通俗讲就是一款软件,不过和一般的软件不同,操作系统是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他的软件都必须在操作系统的支
2022-08-17
14
Gradle 安装 Gradle 安装
Gradle 安装前的准备Gradle 可以安装在 Linux,macOS,Windows 等主流操作系统,唯一的要求就是操作系统上已经安装了 Java JDK 7 及以上版本。可以通过 java -version 验证是否满足条件,以下是
2022-08-14
1 / 2