在从小到大排列的整形堆栈分析中,插入一个元素,使堆栈分析依然有序

遍历找到未排序部分的最小值放到已排序部分的末尾(从小到大排序,反之则是找最大值)


已排序的部分A在整个队列左侧未排序的部分B在队列右侧

  1. 从未排序的部分拿絀第一个元素x(未排序部分最左端,已排序部分的右端)
  2. 将x与它左侧的元素y进行比较(x的左侧始终是从小到大已排序的)
  3. 为了保证加入x后队列A依然是从小到大有序的,因此如果x比y小则x、y交换位置,跳到 步骤2 继续执行如果x比y大,此时加入x元素后的已排序部分A从小到大有序跳到 步骤1 继续执行



将整个需要排序的队列每 h 个单元作为一个独立的队列进行插入排序

定理:经过排序后,使g有序的序列A变为h有序(h < g)则序列A仍然是g有序的

对一个序列进行排序,h-sort中 h 取何队列效率最高

3x + 1 方便编程,效率也很高
Sedgewick(塞奇威克人名) 实践得出的最佳h序列 (非理论最佳,鈳能会有更优解)

希尔排序适用于所有的序列吗
适用于中小规模队列,巨大规模的序列效果不佳

精确模型还没证明不同的h序列复杂度不┅样

  1. 简并现象(点在凸包边上但不是凸包的顶点)



Java 面试随着时间的改变而改变在過去的日子里,当你知道 String 和 StringBuilder 的区别(String 类型和 StringBuffer 类型的主要性能区别其实在于 String 是不可变的对象因此在每次对 String 类型进行改变的时候其实都等同於生成了一个新的 String 对象,然后将指针指向新的 String 对象所以经常改变内容的字符串最好不要用 String ,因为每次生成对象都会对系统性能产生影响特别当内存中无引用对象多了以后,JVM 的 GC 就会开始工作影响性能,可以考虑使用可变字符序列StringBuilder)就能让你直接进入第二轮面试但是现茬问题变得越来越高级,面试官问的问题也更深入 在我初入职场的时候,类似于 Vector 与 Array 的区别、HashMap 与 Hashtable 的区别是最流行的问题只需要记住它们,就能在面试中获得更好的机会但这种情形已经不复存在。如今你将会被问到许多 Java 程序员都没有看过的领域,如 NIO设计模式,成熟的單元测试或者那些很难掌握的知识,如并发、算法、数据结构及编码

由于我喜欢研究面试题,因此我已经收集了许多的面试问题包括许多许多不同的主题。我已经为这众多的问题准备一段时间了现在我将它们分享给你们。这里面不但包含经典的面试问题如线程、集合、equals 和 hashcode、socket,而且还包含了 NIO、数组、字符串、Java 8 等主题

该列表包含了入门级 Java 程序员和多年经验的高级开发者的问题。无论你是 1、2、3、4、5、6、7、8、9 还是 10 年经验的开发者你都能在其中找到一些有趣的问题。这里包含了一些超级容易回答的问题同时包含经验丰富的 Java 程序员也会棘手的问题。

当然你们也是非常幸运的当今有许多好的书来帮助你准备 Java 面试,其中有一本我觉得特别有用和有趣的是 Markham 的 Java 程序面试揭秘(Java Programming Interview Exposed) 这本书会告诉你一些 Java 和 JEE 面试中最重要的主题,即使你不是准备 Java 面试也值得一读。

该问题列表特别长我们有各个地方的问题,所以答案必须要短小、简洁、干脆,不拖泥带水因此,除了这一个段落你只会听到问题与答案,再无其他内容没有反馈,也没有评价为此,我已经写好了一些博文在这些文章中你可以找到我对某些问题的观点,如我为什么喜欢这个问题这个问题的挑战是什么?期朢从面试者那获取到什么样的答案

这个列表有一点不同,我鼓励你采用类似的方式去分享问题和答案这样容易温习。我希望这个列表對面试官和候选人都有很好的用处面试官可以对这些问题上做一些改变以获取新奇和令人惊奇的元素,这对一次好的面试来说非常重要而候选者,可以扩展和测试 Java 程序语言和平台关键领域的知识2015 年,会更多的关注并发概念JVM 内部,32 位 JVM 和 64 JVM的区别单元测试及整洁的代码。我确信如果你读过这个庞大的 Java 面试问题列表,无论是电话面试还是面对面的面试你都能有很好的表现。

Java 面试中的重要话题

除了你看箌的惊人的问题数量我也尽量保证质量。我不止一次分享各个重要主题中的问题也确保包含所谓的高级话题,这些话题很多程序员不囍欢准备或者直接放弃因为他们的工作不会涉及到这些。Java NIO 和 JVM 底层就是最好的例子你也可以将设计模式划分到这一类中,但是越来越多囿经验的程序员了解 GOF 设计模式并应用这些模式我也尽量在这个列表中包含 2015 年最新的面试问题,这些问题可能是来年关注的核心为了给伱一个大致的了解,下面列出这份 Java 面试问题列表包含的主题:

  • 多线程,并发及线程基础
  • 数据类型转换的基本原则
  • SOLID (单一功能、开闭原则、里氏替换、接口隔离以及依赖反转)设计原则
  • Java 中的数据结构和算法

现在是时候给你展示我近 5 年从各种面试中收集来的 120 个问题了我确定你在洎己的面试中见过很多这些问题,很多问题你也能正确回答

多线程、并发及线程的基础问题

能,Java 中可以创建 volatile 类型数组不过只是一个指姠数组的引用,而不是整个数组我的意思是,如果改变引用指向的数组将会受到 volatile 的保护,但是如果多个线程同时改变数组的元素volatile 标礻符就不能起到之前的保护作用了。

2)volatile 能使得一个非原子操作变成原子操作吗

一个典型的例子是在类中有一个 long 类型的成员变量。如果你知道该成员变量会被多个线程访问如计数器、价格等,你最好是将其设置为 volatile为什么?因为 Java 中读取 long 类型变量不是原子的需要分成两步,如果一个线程正在修改该 long 变量的值另一个线程可能只能看到该值的一半(前 32 位)。但是对一个 volatile 型的 long 或 double

3)volatile 修饰符的有过什么实践

一种實践是用 volatile 修饰 long 和 double 变量,使其能按原子类型来读写double 和 long 都是64位宽,因此对这两种类型的读是分为两部分的第一次读取第一个 32 位,然后再读剩下的 32 位这个过程不是原子的,但 Java 中 volatile 型的 long 或 double 变量的读写是原子的volatile 修复符的另一个作用是提供内存屏障(memory barrier),例如在分布式框架中的应鼡简单的说,就是当你写一个 volatile 变量之前Java 内存模型会插入一个写屏障(write barrier),读一个 volatile 变量之前会插入一个读屏障(read barrier)。意思就是说在伱写一个 volatile 域时,能保证任何线程都能看到你写的值同时,在写之前也能保证任何数值的更新对所有线程是可见的,因为内存屏障会将其他所有写的值更新到缓存

4)volatile 类型变量提供什么保证?

volatile 变量提供顺序和可见性保证例如,JVM 或者 JIT为了获得更好的性能会对语句重排序泹是 volatile 类型变量即使在没有同步块的情况下赋值也不会与其他语句重排序。 volatile 提供 happens-before 的保证确保一个线程的修改能对其他线程是可见的。某些凊况下volatile 还能提供原子性,如读 64 位数据类型像 long 和

5) 10 个线程和 2 个线程的同步代码,哪个更容易写

从写代码的角度来说,两者的复杂度是相哃的因为同步代码与线程数量是相互独立的。但是同步策略的选择依赖于线程的数量因为越多的线程意味着更大的竞争,所以你需要利用同步技术如锁分离,这要求更复杂的代码和专业知识

6)你是如何调用 wait()方法的?使用 if 块还是循环为什么?

wait() 方法应该在循环调鼡因为当线程获取到 CPU 开始执行的时候,其他条件可能还没有满足所以在处理前,循环检测条件是否满足会更好下面是一段标准的使鼡 wait 和 notify 方法的代码:

参见 Effective Java 第 69 条,获取更多关于为什么应该在循环中来调用 wait 方法的内容

7)什么是多线程环境下的伪共享(false sharing)?

伪共享是多线程系统(每个处理器有自己的局部缓存)中一个众所周知的性能问题伪共享发生在不同处理器的上的线程对变量的修改依赖于相同的缓存行,如下图所示:

伪共享问题很难被发现因为线程可能访问完全不同的全局变量,内存中却碰巧在很相近的位置上如其他诸多的并發问题,避免伪共享的最基本方式是仔细审查代码根据缓存行来调整你的数据结构。

有经验程序员的 Java 面试题

8)什么是 Busy spin我们为什么要使鼡它?

Busy spin 是一种在不释放 CPU 的基础上等待事件的技术它经常用于避免丢失 CPU 缓存中的数据(如果线程先暂停,之后在其他CPU上运行就会丢失)所以,如果你的工作要求低延迟并且你的线程目前没有任何顺序,这样你就可以通过循环检测队列中的新消息来代替调用 sleep() 或 wait() 方法它唯┅的好处就是你只需等待很短的时间,如几微秒或几纳秒LMAX

9)Java 中怎么获取一份线程 dump 文件?

在 Linux 下你可以通过命令 kill -3 PID (Java 进程的进程 ID)来获取 Java 应鼡的 dump 文件。在 Windows 下你可以按下 Ctrl + Break 来获取。这样 JVM 就会将线程的 dump 文件打印到标准输出或错误文件中它可能打印在控制台或者日志文件中,具体位置依赖应用的配置如果你使用Tomcat。

的线程队列中可以一直等待,也可以通过异步更新直接返回结果你也可以在参考答案中查看和学習到更详细的内容。

11)什么是线程局部变量

当使用ThreadLocal维护变量时,ThreadLocal为每个使用该变量的线程提供独立的变量副本,每个线程都可以独立地改变洎己的副本,而不会影响其它线程所对应的副本,是线程隔离的。线程隔离的秘密在于ThreadLocalMap类(ThreadLocal的静态内部类)

线程局部变量是局限于线程内部的变量属于线程自身所有,不在多个线程间共享Java 提供 ThreadLocal 类来支持线程局部变量,是一种实现线程安全的方式但是在管理环境下(如 web 服务器)使用线程局部变量的时候要特别小心,在这种情况下工作线程的生命周期比任何应用变量的生命周期都要长。任何线程局部变量一旦在笁作完成后没有释放Java 应用就存在内存泄露的风险。

ThreadLocal是如何为每个线程创建变量的副本的:

c、在进行get之前必须先set,否则会报空指针异常;如果想在get之前不需要调用set就能正常访问的话必须重写initialValue()方法

12)用 wait-notify 写一段代码来解决生产者-消费者问题?

请参考答案中的示例代码只要記住在同步块中调用 wait() 和 notify()方法,如果阻塞通过循环来测试等待条件。

请参考答案中的示例代码这里面一步一步教你创建一个线程安全的 Java 單例类。当我们说线程安全时意思是即使初始化是在多线程环境中,仍然能保证单个实例Java 中,使用枚举作为单例类是最简单的方式来創建线程安全单例模式的方式

虽然两者都是用来暂停当前运行的线程,但是 sleep() 实际上只是短暂停顿因为它不会释放锁,而 wait() 意味着条件等待这就是为什么该方法要释放锁,因为只有这样其他等待的线程才能在满足条件时获取到该锁。

15)什么是不可变对象(immutable object)Java 中怎么创建一个不可变对象?

不可变对象指对象一旦被创建状态就不能再改变。任何修改都会创建一个新的对象如 String、Integer及其它包装类。详情参见答案一步一步指导你在 Java 中创建一个不可变的类。

16)我们能创建一个包含可变对象的不可变对象吗

是的,我们是可以创建一个包含可变對象的不可变对象的你只需要谨慎一点,不要共享可变对象的引用就可以了如果需要变化时,就返回原对象的一个拷贝最常见的例孓就是对象中包含一个日期对象的引用。

数据类型和 Java 基础面试问题

17)Java 中应该使用什么数据类型来代表价格

如果不是特别关心内存和性能嘚话,使用BigDecimal否则使用预定义精度的 double 类型。

可以使用 String 接收 byte[] 参数的构造器来进行转换需要注意的点是要使用的正确的编码,否则会使用平囼默认编码这个编码可能跟原来的编码相同,也可能不同

20)我们能将 int 强制转换为 byte 类型的变量吗?如果该值大于 byte 类型的范围将会出现什么现象?

是的我们可以做强制转换,但是 Java 中 int 是 32 位的而 byte 是 8 位的,所以如果强制转化是,int 类型的高 24 位将会被丢弃byte 类型的范围是从 -128 到 127。

可以向下转型。但是不建议使用容易出现类型转型异常.

java.lang.Cloneable 是一个标示性接口,不包含任何方法clone 方法在 object 类中定义。并且需要知道 clone() 方法昰一个本地方法这意味着它是由 c 或 c++ 或 其他本地语言实现的。

23)Java 中 ++ 操作符是线程安全的吗

不是线程安全的操作。它涉及到多个指令如讀取变量值,增加然后存储回内存,这个过程可能会出现多个线程交差

+= 隐式的将加操作的结果类型强制转换为持有结果的类型。如果兩这个整型相加如 byte、short 或者 int,首先会将它们提升到 int 类型然后在执行加法操作。

(因为 a+b 操作会将 a、b 提升为 int 类型所以将 int 类型赋值给 byte 就会编譯出错)

25)我能在不进行强制转换的情况下将一个 double 值赋值给 long 类型的变量吗?

不行你不能在没有强制类型转换的前提下将一个 double 值赋值给 long 类型的变量,因为 double 类型的范围比 long 类型更广所以必须要进行强制转换。

false因为有些浮点数不能完全精确的表示出来。

Integer 对象会占用更多的内存Integer 是一个对象,需要存储对象的元数据但是 int 是一个原始类型的数据,所以占用的空间更少

Java 中的 String 不可变是因为 Java 的设计者认为字符串使用非常频繁,将字符串设置为不可变可以允许多个客户端之间共享相同的字符串更详细的内容参见答案。

从 Java 7 开始我们可以在 switch case 中使用字符串,但这仅仅是一个语法糖内部实现在 switch 中使用字符串的 hash code。

30)Java 中的构造器链是什么

当你从一个构造器中调用另一个构造器,就是Java 中的构慥器链这种情况只在重载了类的构造器的时候才会出现。

Java 中int 类型变量的长度是一个固定值,与平台无关都是 32 位。意思就是说在 32 位 囷 64 位 的Java 虚拟机中,int 类型的长度是相同的

32 位和 64 位的 JVM 中,int 类型变量的长度是相同的都是 32 位或者 4 个字节。

StrongReference 是 Java 的默认引用实现, 它会尽可能长时間的存活于 JVM 内当没有任何对象指向它时将会被GC回收

WeakReference,顾名思义, 是一个弱引用, 当所引用的对象在 JVM 内不再有强引用时, 将被GC回收

WeakHashMap 的工作与正常嘚 HashMap 类似但是使用弱引用作为 key,意思就是当 key 对象没有任何引用时key/value 将会被回收。

当你将你的应用从 32 位的 JVM 迁移到 64 位的 JVM 时由于对象的指针从 32 位增加到了 64 位,因此堆内存会突然增加差不多要翻倍。这也会对 CPU 缓存(容量比内存小很多)的数据产生不利的影响因为,迁移到 64 位的 JVM 主要动机在于可以指定最大堆大小通过压缩 OOP 可以节省一定的内存。通过 -XX:+UseCompressedOops 选项JVM

理论上说上 32 位的 JVM 堆内存可以到达 2^32,即 4GB但实际上会比这个尛很多。不同操作系统之间不同如 Windows 系统大约 1.5 GB,Solaris 大约 3GB64 位 JVM允许指定最大的堆内存,理论上可以达到 2^64这是一个非常大的数字,实际上你可鉯指定堆内存大小到 100GB甚至有的 JVM,如 Azul堆内存到 1000G 都是可能的。

Time compilation)当代码执行的次数超过一定的阈值时,会将 Java 字节码转换为本地代码如,主要的热点代码会被准换为本地代码这样有利大幅度提高 Java 应用的性能。

3 年工作经验的 Java 面试题

当通过 Java 命令启动 Java 进程的时候会为它分配內存。内存的一部分用于创建堆空间当程序中创建对象的时候,就从对空间中分配内存GC 是 JVM 内部的一个进程,回收无效对象的内存用于將来的分配

JVM 底层面试题及答案

41)你能保证 GC 执行吗?

42)怎么获取 Java 程序使用的内存堆使用的百分比?

可以通过 java.lang.Runtime 类中与内存相关方法来获取剩余的内存总内存及最大堆内存。通过这些方法你也可以获取到堆使用的百分比及堆内存的剩余空间Runtime.freeMemory() 方法返回剩余空间的字节数,Runtime.totalMemory() 方法总内存的字节数Runtime.maxMemory() 返回最大内存的字节数。

43)Java 中堆和栈有什么区别

JVM 中堆和栈属于不同的内存区域,使用目的也不同栈常用于保存方法帧和局部变量,而对象总是在堆上分配栈通常都比堆小,也不会在多个线程之间共享而堆被整个 JVM 的所有线程共享。 Difference between stack and heap memory in Java

关于内存的的面試问题和答案

Java 基本概念面试题

如果 a 和 b 都是对象则 a==b 是比较两个对象的引用,只有当 a 和 b 指向的是堆中的同一个对象才会返回 true而 a.equals(b) 是进行逻辑仳较,所以通常需要重写该方法来提供逻辑一致性的比较例如,String 类重写 equals() 方法所以可以用于两个不同对象,但是包含的字母相同的比较

final 是一个修饰符,可以修饰变量、方法和类如果 final 修饰变量,意味着该变量的值在初始化后不能被改变Java 技术允许使用 finalize() 方法在垃圾收集器將对象从内存中清除出去之前做必要的清理工作。这个方法是由垃圾收集器在确定这个对象没有被引用时对这个对象调用的但是什么时候调用 finalize 没有保证。finally 是一个关键字与 try 和 catch 一起用于异常的处理。finally 块一定会被执行无论在 try 块中是否有发生异常。

47)Java 中的编译期常量是什么使用它又什么风险?

公共静态不可变(public static final )变量也就是我们所说的编译期常量这里的 public 可选的。实际上这些变量在编译时会被替换掉因为編译器知道这些变量的值,并且知道这些变量在运行时不能改变这种方式存在的一个问题是你使用了一个内部的或第三方库中的公有编譯时常量,但是这个值后面被其他人改变了但是你的客户端仍然在使用老的值,甚至你已经部署了一个新的jar为了避免这种情况,当你茬更新依赖 JAR 文件时确保重新编译你的程序。

Java 集合框架的面试题

这部分也包含数据结构、算法及数组的面试问题

List 是一个有序集合允许元素重复。它的某些实现可以提供基于下标值的常量访问时间但是这不是 List 接口保证的。Set 是一个无序集合

poll() 和 remove() 都是从队列中取出一个元素,泹是 poll() 在获取元素失败的时候会返回空但是 remove() 失败的时候会抛出异常。

PriorityQueue 保证最高或者最低优先级的的元素总是在队列头部但是 LinkedHashMap 维持的顺序昰元素插入的顺序。当遍历一个 PriorityQueue 时没有任何顺序保证,但是 LinkedHashMap 课保证遍历顺序是元素插入的顺序

最明显的区别是 ArrrayList 底层的数据结构是数组,支持随机访问而 LinkedList 的底层数据结构书链表,不支持随机访问使用下标访问一个元素,ArrayList 的时间复杂度是 O(1)而 LinkedList 是 O(n)。更多细节的讨论参见答案

52)用哪两种方式来实现集合的排序?(答案)

是双向链表你可以检查 JDK 的源码。在 Eclipse你可以使用快捷键 Ctrl + T,直接在编辑器中打开该类

这两個类有许多不同的地方,下面列出了一部分: a) Hashtable 是 JDK 1 遗留下来的类而 HashMap 是后来增加的。 b)Hashtable 是同步的比较慢,但 HashMap 没有同步策略所以会更快。 c)Hashtable 不允许有个空的 key但是 HashMap 允许出现一个 null key。 更多的不同之处参见答案

58)写一段代码在遍历 ArrayList 时移除一个元素?(答案)

59)我们能自己写一个容器類然后使用 for-each 循环吗?

可以你可以写一个自己的容器类。如果你想使用 Java 中增强的循环来遍历你只需要实现 Iterable 接口。如果你实现 Collection 接口默認就具有该属性。

61)有没有可能两个不相等的对象有有相同的 hashcode

有可能,两个不相等的对象可能会有相同的 hashcode 值这就是为什么在 hashmap 中会有冲突。相等 hashcode 值的规定只是说如果两个对象相等必须有相同的hashcode 值,但是没有关于不相等对象的任何规定

62)两个相同的对象会有不同的的 hash code 吗?

不能根据 hash code 的规定,这是不可能的

63)我们可以在 hashcode() 中使用随机数字吗?(答案)

不行因为对象的 hashcode 值必须是相同的。参见答案获取更多关于 Java Φ重写 hashCode() 方法的知识

Comparable 接口用于定义对象的自然顺序,而 comparator 通常用于定义用户定制的顺序Comparable 总是只有一个,但是可以有多个 comparator 来定义对象的顺序

IO 是 Java 面试中一个非常重要的点。你应该很好掌握 Java IONIO,NIO2 以及与操作系统磁盘 IO 相关的基础知识。下面是 Java IO 中经常问的问题

66)在我 Java 程序中,我囿三个 socket我需要多少个线程来处理?

69)Java 采用的是大端还是小端

71)Java 中,直接缓冲区与非直接缓冲器有什么区别(答案)

72)Java 中的内存映射缓存區是什么?(answer答案)

Java 最佳实践的面试问题

包含 Java 中各个部分的最佳实践如集合,字符串IO,多线程错误和异常处理,设计模式等等

76)Java 中,編写多线程程序的时候你会遵循哪些最佳实践(答案)

这是我在写Java 并发程序的时候遵循的一些最佳实践: a)给线程命名,这样可以帮助调试 b)最小化同步的范围,而不是将整个方法同步只对关键部分做同步。 c)如果可以更偏向于使用 volatile 而不是 synchronized。 d)使用更高层次的并发工具而不是使用 wait() 和 notify() 来实现线程间通信,如

这是我在使用 Java 中 Collectionc 类的一些最佳实践: a)使用正确的集合类例如,如果不需要同步列表使用 ArrayList 而不昰 Vector。 b)优先使用并发集合而不是对集合进行同步。并发集合提供更好的可扩展性 c)使用接口代表和访问集合,如使用List存储 ArrayList使用 Map 存储 HashMap 等等。 d)使用迭代器来循环集合 e)使用集合的时候使用泛型。

78)说出至少 5 点在 Java 中使用线程的最佳实践(答案)

这个问题与之前的问题类似,你可以使用上面的答案对线程来说,你应该: a)对线程命名 b)将线程和任务分离使用线程池执行器来执行 Runnable 或 Callable。 c)使用线程池

IO 对 Java 应用嘚性能非常重要理想情况下,你不应该在你应用的关键路径上避免 IO 操作下面是一些你应该遵循的 Java IO 最佳实践: a)使用有缓冲区的 IO 类,而鈈要单独读取字节或字符 b)使用 NIO 和 NIO2 c)在 finally 块中关闭流,或者使用 try-with-resource(Java7) 语句 d)使用内存映射文件获取更快的 IO。

80)列出 5 个应该遵循的 JDBC 最佳实踐(答案)

有很多的最佳实践你可以根据你的喜好来例举。下面是一些更通用的原则: a)使用批量的操作来插入和更新数据 b)使用 PreparedStatement 来避免 SQL 异瑺并提高性能。 c)使用数据库连接池 d)通过列名来获取结果集不要使用列的下标来获取。

81)说出几条 Java 中方法重载的最佳实践(答案)

下媔有几条可以遵循的方法重载的最佳实践来避免造成自动装箱的混乱。 a)不要重载这样的方法:一个方法接收 int 参数而另个方法接收 Integer 参数。 b)不要重载参数数量一致而只是参数顺序不同的方法。 c)如果重载的方法参数个数多于 5 个采用可变参数。

不是非常不幸,DateFormat 的所有實现包括 SimpleDateFormat 都不是线程安全的,因此你不应该在多线程序中使用除非是在对外线程安全的环境中使用,如 将 SimpleDateFormat 限制在 ThreadLocal 中如果你不这么做,在解析或者格式化日期的时候可能会获取到一个不正确的结果。因此从日期、时间处理的所有实践来说,我强力推荐

83)Java 中如何格式囮一个日期如格式化为 ddMMyyyy 的形式?(答案)

Java 中可以使用 SimpleDateFormat 类或者 joda-time 库来格式日期。DateFormat 类允许你使用多种流行的格式来格式化日期参见答案中的示唎代码,代码中演示了将日期格式化成不同的格式如 dd-MM-yyyy 或 ddMMyyyy。

84)Java 中怎么在格式化的日期中显示时区?

的父类前者是常用的表示时间的类,我们通常格式化或者得到当前时间都是用他后者之后在读写数据库的时候用他,因为PreparedStament的setDate()的第2参数和ResultSet的getDate()方法的第2个参数都是java.sql.Date

86)Java 中,如哬计算两个日期之间的差距

 

 
89)如何测试静态方法?(答案)
可以使用 PowerMock 库来测试静态方法
90)怎么利用 JUnit 来测试一个方法的异常?(答案)
91)你使用過哪个单元测试库来测试你的 Java 程序(答案)

编程和代码相关的面试题

 
93)怎么检查一个字符串只包含数字?(解决方案)
94)Java 中如何利用泛型写一个 LRU 緩存(答案)

95)在不使用 StringBuffer 的前提下,怎么反转一个字符串(解决方案)
97)Java 中,怎么获取一个文件中单词出现的最高频率(解决方案)
98)如何检查絀两个给定的字符串是反序的?(解决方案)
99)Java 中怎么打印出一个字符串的所有排列?(解决方案)
100)Java 中怎样才能打印出数组中的重复元素?(解决方案)
101)Java 中如何将字符串转换为整数(解决方案)
102)在没有使用临时变量的情况如何交换两个整数变量的值?(解决方案)
交换两个值不用臨时变量?我们通过位运算中的异或来实现。 //测试代码为C语言代码

1.一个整数自己跟自己异或结果为0 //因为异或的法则为,相同为0不同为1,紸意这里所说的都是二进制位
2.任意一个整数跟0异或,结果为本身 //因为1异或0得1,0异或0,得0,所以1还是1,0还是0没发生变化。

分析下a和b发生交换嘚原因:

根据以上代码不难得出以下表达式:

根据前面说的前置知识不难明白a和b,为什么发生交换了

关于 OOP 和设计模式的面试题

这部分包含 Java 面试过程中关于 SOLID 的设计原则,OOP 基础如类,对象接口,继承多态,封装抽象以及更高级的一些概念,如组合、聚合及关联也包含了 GOF 设计模式的问题。

103)接口是什么为什么要使用接口而不是直接使用具体类?

接口用于定义 API它定义了类必须得遵循的规则。同时咜提供了一种抽象,因为客户端只使用接口这样可以有多重实现,如 List 接口你可以使用可随机访问的 ArrayList,也可以使用方便插入和删除的 LinkedList接口中不允许写代码,以此来保证抽象但是 Java 8 中你可以在接口声明静态的默认方法,这种方法是具体的

104)Java 中,抽象类与接口之间有什么鈈同(答案)

Java 中,抽象类和接口有很多不同之处但是最重要的一个是 Java 中限制一个类只能继承一个类,但是可以实现多个接口抽象类可以佷好的定义一个家族类的默认行为,而接口能更好的定义类型有助于后面实现多态机制。关于这个问题的讨论请查看答案

105)除了单例模式,你在生产环境中还用过什么设计模式

这需要根据你的经验来回答。一般情况下你可以说依赖注入,工厂模式装饰模式或者观察者模式,随意选择你使用过的一种即可不过你要准备回答接下的基于你选择的模式的问题。

106)你能解释一下里氏替换原则吗?(答案)

107) 什么凊况下会违反迪米特法则为什么会有这个问题?(答案)

迪米特法则建议“只和朋友说话不要陌生人说话”,以此来减少类之间的耦合

108)适配器模式是什么?什么时候使用

适配器模式提供对接口的转换。如果你的客户端使用某些接口但是你有另外一些接口,你就可以寫一个适配去来连接这些接口

109)什么是“依赖注入”和“控制反转”?为什么有人使用(答案)

110)抽象类是什么?它与接口有什么区别伱为什么要使用过抽象类?(答案)

抽象方法:由abstract修饰的方法为抽象方法抽象方法只有方法的定义,没有方法的实现
抽象类:一个类中如果包含抽象方法,个i类应该用abstract关键字声明为抽象类
抽象类不可以实例化,即使一个类中没有抽象方法也可以将其定义为抽象类,同样该类不可以实例化。
 1为子类提供一个公共的类型;
 2,封装子类中重复内容(成员变量和方法);
 3定义有抽象方法,子类虽然有不同嘚实现但该方法的定义是一致的。
抽象类:为了被子类继承为子类提供了同一的方法入口;
接口:定义了一个标准(特殊的抽象类)。

111)构造器注入和 setter 依赖注入那种方式更好?(答案)

每种方式都有它的缺点和优点构造器注入保证所有的注入都被初始化,但是 setter 注入提供哽好的灵活性来设置可选依赖如果使用 XML 来描述依赖,Setter 注入的可读写会更强经验法则是强制依赖使用构造器注入,可选依赖使用 setter 注入

112)依赖注入和工厂模式之间有什么不同?(答案)

虽然两种模式都是将对象的创建从应用的逻辑中分离但是依赖注入比工程模式更清晰。通過依赖注入你的类就是 POJO,它只知道依赖而不关心它们怎么获取使用工厂模式,你的类需要通过工厂来获取依赖因此,使用 DI 会比使用笁厂模式更容易测试关于这个话题的更详细讨论请参见答案。

113)适配器模式和装饰器模式有什么区别(答案)

虽然适配器模式和装饰器模式的结构类似,但是每种模式的出现意图不同适配器模式被用于桥接两个接口,而装饰模式的目的是在不修改类的情况下给类增加新的功能

114)适配器模式和代理模式之前有什么不同?(答案)

这个问题与前面的类似适配器模式和代理模式的区别在于他们的意图不同。由于適配器模式和代理模式都是封装真正执行动作的类因此结构是一致的,但是适配器模式用于接口之间的转换而代理模式则是增加一个額外的中间层,以便支持分配、控制或智能访问

115)什么是模板方法模式?(答案)

模板方法提供算法的框架你可以自己去配置或定义步骤。例如你可以将排序算法看做是一个模板。它定义了排序的步骤但是具体的比较,可以使用 Comparable 或者其语言中类似东西具体策略由你去配置。列出算法概要的方法就是众所周知的模板方法

116)什么时候使用访问者模式?(答案)

访问者模式用于解决在类的继承层次上增加操作但是不直接与之关联。这种模式采用双派发的形式来增加中间层

117)什么时候使用组合模式?(答案)

组合模式使用树结构来展示部分与整體继承关系它允许客户端采用统一的形式来对待单个对象和对象容器。当你想要展示对象这种部分与整体的继承关系时采用组合模式

118)继承和组合之间有什么不同?(答案)

虽然两种都可以实现代码复用但是组合比继承共灵活,因为组合允许你在运行时选择不同的实现鼡组合实现的代码也比继承测试起来更加简单。

119)描述 Java 中的重载和重写(答案)

重载和重写都允许你用相同的名称来实现不同的功能,但是偅载是编译时活动而重写是运行时活动。你可以在同一个类中重载方法但是只能在子类中重写方法。重写必须要有继承

120)Java 中,嵌套公共静态类与顶级类有什么不同(答案)

类的内部可以有多个嵌套公共静态类,但是一个 Java 源文件只能有一个顶级公共类并且顶级公共类的洺称与源文件名称必须一致。

121) OOP 中的 组合、聚合和关联有什么区别(答案)

如果两个对象彼此有关系,就说他们是彼此相关联的组合和聚合昰面向对象中的两种形式的关联。组合是一种比聚合更强力的关联组合中,一个对象是另一个的拥有者而聚合则是指一个对象使用另┅个对象。如果对象 A 是由对象 B 组合的则 A 不存在的话,B一定不存在但是如果 A 对象聚合了一个对象 B,则即使 A 不存在了B 也可以单独存在。

122)给我一个符合开闭原则的设计模式的例子(答案)

开闭原则要求你的代码对扩展开放,对修改关闭这个意思就是说,如果你想增加一个噺的功能你可以很容易的在不改变已测试过的代码的前提下增加新的代码。有好几个设计模式是基于开闭原则的如策略模式,如果你需要一个新的策略只需要实现接口,增加配置不需要改变核心逻辑。一个正在工作的例子是 Collections.sort() 方法这就是基于策略模式,遵循开闭原則的你不需为新的对象修改 sort() 方法,你需要做的仅仅是实现你自己的 Comparator 接口

123)抽象工厂模式和原型模式之间的区别?(答案)

124)什么时候使用享元模式(答案)

享元模式通过共享对象来避免创建太多的对象。为了使用享元模式你需要确保你的对象是不可变的,这样你才能安全的囲享JDK 中 String 池、Integer 池以及 Long 池都是很好的使用了享元模式的例子。

Java 面试中其他各式各样的问题

这部分包含 Java 中关于 XML 的面试题JDBC 面试题,正则表达式媔试题Java 错误和异常及序列化面试题

125)嵌套静态类与顶级类有什么区别?(答案)

一个公共的顶级类的源文件名称与类名相同而嵌套静态类沒有这个要求。一个嵌套类位于顶级类内部需要使用顶级类的名称来引用嵌套静态类,如 HashMap.Entry 是一个嵌套静态类HashMap 是一个顶级类,Entry是一个嵌套静态类

126)你能写出一个正则表达式来判断一个字符串是否是一个数字吗?(解决方案)

一个数字字符串只能包含数字,如 0 到 9 以及 +、- 开头通过这个信息,你可以下一个如下的正则表达式来判断给定的字符串是不是数字

127)Java 中,受检查异常 和 不受检查异常的区别(答案)

受检查异常编译器在编译期间检查。对于这种异常方法强制处理或者通过 throws 子句声明。其中一种情况是 Exception 的子类但不是 RuntimeException 的子类非受检查是 RuntimeException 的子類,在编译阶段不受编译器的检查

的作用是作为方法声明和签名的一部分,方法被抛出相应的异常以便调用者能处理Java 中,任何未处理嘚受检查异常强制在 throws 子句中声明

Serializable 接口是一个序列化 Java 类的接口,以便于它们可以在网络上传输或者可以将它们的状态保存在磁盘上是 JVM 内嵌的默认序列化方式,成本高、脆弱而且不安全Externalizable 允许你控制整个序列化过程,指定特定的二进制格式增加安全机制。

DOM 解析器将整个 XML 文檔加载到内存来创建一棵 DOM 模型树这样可以更快的查找节点和修改 XML 结构,而 SAX 解析器是一个基于事件的解析器不会将整个 XML 文档加载到内存。由于这个原因DOM 比 SAX 更快,也要求更多的内存不适合于解析大 XML 文件。

变量和文本菱形操作符(<>)用于类型推断,不再需要在变量声明的右邊申明泛型因此可以写出可读写更强、更简洁的代码。另一个值得一提的特性是改善异常处理如允许在同一个 catch 块中捕获多个异常。

Java 8 在 Java 曆史上是一个开创新的版本下面 JDK 8 中 5 个主要的特性: Lambda 表达式,允许像对象一样传递匿名函数 Stream API充分利用现代多核 CPU,可以写出很简洁的代码 Date 與 Time API最终,有一个稳定、简单的日期和时间库可供你使用 扩展方法现在,接口中可以有静态、默认方法 重复注解,现在你可以将相同嘚注解在同一类型上使用多次

虽然两者都是构建工具,都用于创建 Java 应用但是 Maven 做的事情更多,在基于“约定优于配置”的概念下提供標准的Java 项目结构,同时能为应用自动管理依赖(应用中所依赖的 JAR 文件)Maven 与 ANT 工具更多的不同之处请参见答案。

这就是所有的面试题如此の多,是不是我可以保证,如果你能回答列表中的所有问题你就可以很轻松的应付任何核心 Java 或者高级 Java 面试。虽然这里没有涵盖 Servlet、JSP、JSF、JPA,JMSEJB 及其它 Java EE 技术,也没有包含主流的框架如 Spring MVCStruts 2.0,Hibernate也没有包含 SOAP 和 RESTful web service,但是这份列表对做 Java 开发的、准备应聘 Java web 开发职位的人还是同样有用的洇为所有的 Java 面试,开始的问题都是 Java 基础和 JDK API 相关的如果你认为我这里有任何应该在这份列表中而被我遗漏了的 Java 流行的问题,你可以自由的給我建议我的目的是从最近的面试中创建一份最新的、最优的 Java 面试问题列表。

下面是Java线程相关的热门面试题你可以用它来好好准备面試。

线程是操作系统能够进行运算调度的最小单位它被包含在进程之中,是进程中的实际运作单位程序员可以通过它进行多处理器编程,你可以使用多线程对运算密集型任务提速比如,如果一个线程完成一个任务要100毫秒那么用十个线程完成改任务只需10毫秒。Java在语言層面对多线程提供了卓越的支持它也是一个很好的卖点。

2) 线程和进程有什么区别

线程是进程的子集,一个进程可以有很多线程每条線程并行执行不同的任务。不同的进程使用不同的内存空间而所有的线程共享一片相同的内存空间。别把它和栈内存搞混每个线程都擁有单独的栈内存用来存储本地数据。

3) 如何在Java中实现线程

在语言层面有两种方式。java.lang.Thread 类的实例就是一个线程但是它需要调用java.lang.Runnable接口来执行甴于线程类本身就是调用的Runnable接口所以你可以继承java.lang.Thread 类或者直接调用Runnable接口来重写run()方法实现线程。

这个问题是上题的后续大家都知道我们可以通过继承Thread类或者调用Runnable接口来实现线程,问题是那个方法更好呢?什么情况下使用它这个问题很容易回答,如果你知道Java不支持类的多重繼承但允许你调用多个接口。所以如果你要继承其他类当然是调用Runnable接口好了。

这个问题经常被问到但还是能从此区分出面试者对Java线程模型的理解程度。start()方法被用来启动新创建的线程而且start()内部调用了run()方法,这和直接调用run()方法的效果不一样当你调用run()方法的时候,只会昰在原来的线程中调用没有新的线程启动,start()方法才会启动新线程

7)如何强制启动一个线程?

这个问题就像是如何强制进行Java垃圾回收目前还没有觉得方法,虽然你可以使用System.gc()来进行垃圾回收但是不保证能成功。在Java里面没有办法强制启动一个线程它是被线程调度器控制著且Java没有公布相关的API。

9) Java内存模型是什么

Java内存模型规定和指引Java程序在不同的内存架构、CPU和操作系统间有确定性地行为。它在多线程的情况丅尤其重要Java内存模型对一个线程所做的变动能被其它线程可见提供了保证,它们之间是先行发生关系这个关系定义了一些规则让程序員在并发编程时思路更清晰。比如先行发生关系确保了:


线程内的代码能够按先后顺序执行,这被称为程序次序规则
对于同一个锁,┅个解锁操作一定要发生在时间上后发生的另一个锁定操作之前也叫做管程锁定规则。
前一个对volatile的写操作在后一个volatile的读操作之前也叫volatile變量规则。
一个线程内的任何操作必需在这个线程的start()调用之后也叫作线程启动规则。
一个线程的所有操作都会在线程终止之前线程终圵规则。
一个对象的终结操作必需在这个对象构造完成之后也叫对象终结规则。

volatile是一个特殊的修饰符只有成员变量才能使用它。在Java并發程序缺少同步类的情况下多线程对成员变量的操作对其它线程是透明的。volatile变量可以保证下一个读取操作会在前一个写操作之后发生僦是上一题的volatile变量规则。点击这里查看更多volatile的相关内容

11) 什么是线程安全?Vector是一个线程安全类吗 

如果你的代码所在的进程中有多个线程茬同时运行,而这些线程可能会同时运行这段代码如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是┅样的就是线程安全的。一个线程安全的计数器类的同一个实例对象在被多个线程使用的情况下也不会出现计算失误很显然你可以将集合类分成两组,线程安全和非线程安全的Vector 是用同步方法来实现线程安全的, 而和它相似的ArrayList不是线程安全的。

12) Java中什么是竞态条件 举个例孓说明。

竞态条件会导致程序在并发情况下出现一些bugs多线程对一些资源的竞争的时候就会产生竞态条件,如果首先要执行的程序竞争失敗排到后面执行了那么整个程序就会出现一些不确定的bugs。这种bugs很难发现而且会重复出现因为线程间的随机竞争。

13) Java中如何停止一个线程

Java提供了很丰富的API但没有为停止线程提供API。JDK 1.0本来有一些像stop(), suspend() 和 resume()的控制方法但是由于潜在的死锁威胁因此在后续的JDK版本中他们被弃用了之后Java API嘚设计者就没有提供一个兼容且线程安全的方法来停止一个线程。当run() 或者 call() 方法执行完的时候线程会自动结束,如果要手动结束一个线程你鈳以用volatile 布尔变量来退出run()方法的循环或者是取消任务来中断线程。

14) 一个线程运行时发生异常会怎样

这是我在一次面试中遇到的一个很刁钻嘚Java面试题,

15) 如何在两个线程间共享数据?

你可以通过共享对象来实现这个目的或者是使用像阻塞队列这样并发的数据结构。这篇教程《Java線程间通信》(涉及到在两个线程间共享对象)用wait和notify方法实现了生产者消费者模型

这又是一个刁钻的问题,因为多线程可以等待单监控锁Java API 嘚设计人员提供了一些方法当等待条件改变的时候通知它们,但是这些方法没有完全实现notify()方法不能唤醒某个具体的线程,所以只有一个線程在等待的时候它才有用武之地而notifyAll()唤醒所有线程并允许他们争夺锁确保了至少有一个线程能继续运行。

这是个设计相关的问题它考察的是面试者对现有系统和一些普遍存在但看起来不合理的事物的看法。回答这些问题的时候你要说明为什么把这些方法放在Object类里是有意义的,还有不把它放在Thread类里的原因一个很明显的原因是JAVA提供的锁是对象级的而不是线程级的,每个对象都有锁通过线程获得。如果線程需要等待某些锁那么调用对象中的wait()方法就有意义了如果wait()方法定义在Thread类中,线程正在等待的是哪个锁就不明显了简单的说,由于waitnotify囷notifyAll都是锁级别的操作,所以把他们定义在Object类中因为锁属于对象你也可以查看这篇文章了解更多

ThreadLocal是Java里一种特殊的变量。每个线程都有一个ThreadLocal僦是每个线程都拥有了自己独立的一个变量竞争条件被彻底消除了。它是为创建代价高昂的对象获取线程安全的好方法比如你可以用ThreadLocal讓SimpleDateFormat变成线程安全的,因为那个类创建代价高昂且每次调用都需要创建不同的实例所以不值得在局部范围使用它如果为每个线程提供一个洎己独有的变量拷贝,将大大提高效率首先,通过复用减少了代价高昂的对象的创建个数其次,你在没有使用高代价的同步或者不变性的情况下获得了线程安全线程局部变量的另一个不错的例子是ThreadLocalRandom类,它在多线程环境中减少了创建代价高昂的Random对象的个数

在Java并发程序ΦFutureTask表示一个可以取消的异步运算。它有启动和取消运算、查询运算是否完成和取回运算结果等方法只有当运算完成的时候结果才能取回,如果运算尚未完成get方法将会阻塞一个FutureTask对象可以对调用了Callable和Runnable的对象进行包装,由于FutureTask也是调用了Runnable接口所以它可以提交给Executor来执行

isInterrupted()的主要区別是前者会将中断状态清除而后者不会。Java多线程的中断机制是用内部标识来实现的调用Thread.interrupt()来中断一个线程就会设置中断标识为true。当中断线程调用静态方法Thread.interrupted()来检查中断状态时中断状态会被清零。而非静态方法isInterrupted()用来查询其它线程的中断状态且不会改变中断状态标识简单的说僦是任何抛出InterruptedException异常的方法都会将中断状态清零。无论如何一个线程的中断状态有有可能被其它线程调用中断来改变。

21) 为什么wait和notify方法要在哃步块中调用

主要是因为Java API强制要求这样做,如果你不这么做你的代码会抛出IllegalMonitorStateException异常。还有一个原因是为了避免wait和notify之间产生竞态条件

22) 为什么你应该在循环中检查等待条件?

处于等待状态的线程可能会收到错误警报和伪唤醒,如果不在循环中检查等待条件程序就会在没有满足结束条件的情况下退出。因此当一个等待线程醒来时,不能认为它原来的等待状态仍然是有效的在notify()方法调用之后和等待线程醒来之湔这段时间它可能会改变。这就是在循环中使用wait()方法效果更好的原因你可以在Eclipse中创建模板调用wait和notify试一试。如果你想了解更多关于这个问題的内容我推荐你阅读《Effective Java》这本书中的线程和同步章节。

23) Java中的同步集合与并发集合有什么区别

同步集合与并发集合都为多线程和并发提供了合适的线程安全的集合,不过并发集合的可扩展性更高在Java1.5之前程序员们只有同步集合来用且在多线程并发的时候会导致争用,阻礙了系统的扩展性Java5介绍了并发集合像ConcurrentHashMap,不仅提供线程安全还用锁分离和内部分区等现代技术提高了可扩展性

24) Java中堆和栈有什么不同?

為什么把这个问题归类在多线程和并发面试题里因为栈是一块和线程紧密相关的内存区域。每个线程都有自己的栈内存用于存储本地變量,方法参数和栈调用一个线程中存储的变量对其它线程是不可见的。而堆是所有线程共享的一片公用内存区域对象都在堆里创建,为了提升效率线程会从堆中弄一个缓存到自己的栈如果多个线程使用该变量就可能引发问题,这时volatile 变量就可以发挥作用了它要求线程从主存中读取变量的值。

25) 什么是线程池 为什么要使用它?

创建线程要花费昂贵的资源和时间如果任务来了才创建线程那么响应时間会变长,而且一个进程能创建的线程数有限为了避免这些问题,在程序启动的时候就创建若干线程来响应处理它们被称为线程池,裏面的线程叫工作线程从JDK1.5开始,Java API提供了Executor框架让你可以创建不同的线程池比如单线程池,每次处理一个任务;数目固定的线程池或者是緩存线程池(一个适合很多生存期短的任务的程序的可扩展线程池)

26) 如何写代码来解决生产者消费者问题?

在现实中你解决的许多线程问题都属于生产者消费者模型就是一个线程生产任务供其它线程进行消费,你必须知道怎么进行线程间通信来解决这个问题比较低級的办法是用wait和notify来解决这个问题,比较赞的办法是用Semaphore 或者 BlockingQueue来实现生产者消费者模型这篇教程有实现它。

27) 如何避免死锁

死锁是指两个戓两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象若无外力作用,它们都将无法推进下去这是一个严重的问題,因为死锁会让你的程序挂起无法完成任务死锁的发生必须满足以下四个条件:


互斥条件:一个资源每次只能被一个进程使用。
请求與保持条件:一个进程因请求资源而阻塞时对已获得的资源保持不放。
不剥夺条件:进程已获得的资源在末使用完之前,不能强行剥奪
循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
最简单的方法就是阻止循环等待条件将系统中所有的资源设置标志位、排序,规定所有的进程申请资源必须以一定的顺序(升序或降序)做操作来避免死锁这篇教程有代码示例和避免死锁的讨论細节。

28) Java中活锁和死锁有什么区别

这是上题的扩展,活锁和死锁类似不同之处在于处于活锁的线程或进程的状态是不断改变的,活锁可鉯认为是一种特殊的饥饿一个现实的活锁例子是两个人在狭小的走廊碰到,两个人都试着避让对方好让彼此通过但是因为避让的方向嘟一样导致最后谁都不能通过走廊。简单的说就是活锁和死锁的主要区别是前者进程的状态可以改变但是却不能继续执行。

29) 怎么检测┅个线程是否拥有锁

我一直不知道我们竟然可以检测一个线程是否拥有锁,直到我参加了一次电话面试在java.lang.Thread中有一个方法叫holdsLock(),它返回true如果当且仅当当前线程拥有某个具体对象的锁

30) 你如何在Java中获取线程堆栈分析?

对于不同的操作系统有多种方法来获得Java进程的线程堆栈分析。当你获取线程堆栈分析时JVM会把所有线程的状态存到日志文件或者输出到控制台。在Windows你可以使用Ctrl + Break组合键来获取线程堆栈分析Linux下用kill -3命囹。你也可以用jstack这个工具来获取它对线程id进行操作,你可以用jps这个工具找到id

31) JVM中哪个参数是用来控制线程的栈堆栈分析小的

这个问题很簡单, -Xss参数用来控制线程的堆栈分析大小你可以查看JVM配置列表来了解这个参数的更多信息。

Java在过去很长一段时间只能通过synchronized关键字来实现互斥它有一些缺点。比如你不能扩展锁之外的方法或者块边界尝试获取锁时不能中途取消等。Java 5 通过Lock接口提供了更复杂的控制来解决这些问题 ReentrantLock 类实现了 Lock,它拥有与 synchronized 相同的并发性和内存语义且它还具有可扩展性

33) 有三个线程T1,T2T3,怎么确保它们按顺序执行

在多线程中囿多种方法让线程按特定顺序执行,你可以用线程类的join()方法在一个线程中启动另一个线程另外一个线程完成该线程继续执行。为了确保彡个线程的顺序你应该先启动最后一个(T3调用T2T2调用T1),这样T1就会先完成而T3最后完成

Yield方法可以暂停当前正在执行的线程对象,让其它有相同優先级的线程执行它是一个静态方法而且只保证当前线程放弃CPU占用而不能保证使其它线程一定能占用CPU,执行yield()的线程有可能在进入到暂停狀态后马上又被执行

ConcurrentHashMap把实际map划分成若干部分来实现它的可扩展性和线程安全。这种划分是使用并发度获得的它是ConcurrentHashMap类构造函数的一个可選参数,默认值为16这样在多线程情况下就能避免争用。

Java中的Semaphore是一种新的同步类它是一个计数信号。从概念上讲从概念上讲,信号量維护了一个许可集合如有必要,在许可可用前会阻塞每一个 acquire()然后再获取该许可。每个 release()添加一个许可从而可能释放一个正在阻塞的获取者。但是不使用实际的许可对象,Semaphore只对可用许可的号码进行计数并采取相应的行动。

37)如果你提交任务时线程池队列已满。会时發会生什么

这个问题问得很狡猾,许多程序员会认为该任务会阻塞直到线程池队列有空位事实上如果一个任务不能被调度执行那么ThreadPoolExecutor’s submit()方法将会抛出一个RejectedExecutionException异常。

39) 什么是阻塞式方法

阻塞式方法是指程序会一直等待该方法完成期间不做其他事情,ServerSocket的accept()方法就是一直等待客户端連接这里的阻塞是指调用结果返回之前,当前线程会被挂起直到得到结果之后才会返回。此外还有异步和非阻塞式方法在任务完成湔就返回。

40) Swing是线程安全的吗 为什么?

你可以很肯定的给出回答Swing不是线程安全的,但是你应该解释这么回答的原因即便面试官没有问你為什么当我们说swing不是线程安全的常常提到它的组件,这些组件不能在多线程中进行修改所有对GUI组件的更新都要在AWT线程中完成,而Swing提供叻同步和异步两种回调方法来进行更新

这两个方法是Swing API 提供给Java开发者用来从当前线程而不是事件派发线程更新GUI组件用的InvokeAndWait()同步更新GUI组件,比洳一个进度条一旦进度更新了,进度条也要做出相应改变如果进度被多个线程跟踪,那么就调用invokeAndWait()方法请求事件派发线程对组件进行相應更新而invokeLater()方法是异步调用更新组件的。

这个问题看起来和多线程没什么关系 但不变性有助于简化已经很复杂的并发程序。Immutable对象可以在沒有同步的情况下共享降低了对该对象进行并发访问时的同步化开销。可是Java没有@Immutable这个注解符要创建不可变类,要实现下面几个步骤:通过构造方法初始化所有成员、对变量不要提供setter方法、将所有的成员声明为私有的这样就不允许直接访问这些成员、在getter方法中,不要直接返回对象本身而是克隆对象,并返回对象的拷贝

一般而言,读写锁是用来提升并发程序性能的锁分离技术的成果Java中的ReadWriteLock是Java 5 中新增的┅个接口,一个ReadWriteLock维护一对关联的锁一个用于只读操作一个用于写。在没有写线程的情况下一个读锁可能会同时被多个读线程持有写锁昰独占的,你可以使用JDK中的ReentrantReadWriteLock来实现这个规则它最多支持65535个写锁和65535个读锁。

45) 多线程中的忙循环是什么?

忙循环就是程序员用循环让一个线程等待不像传统方法wait(), sleep() 或 yield() 它们都放弃了CPU控制,而忙循环不会放弃CPU它就是在运行一个空循环。这么做的目的是为了保留CPU缓存在多核系统中,一个等待线程醒来的时候可能会在另一个内核运行这样会重建缓存。为了避免重建缓存和减少等待重建的时间就可以使用它了

这是個有趣的问题。首先volatile 变量和 atomic 变量看起来很像,但功能却不一样Volatile变量可以确保先行关系,即写操作会发生在后续的读操作之前, 但它并不能保证原子性例如用volatile修饰count变量那么 count++ 操作就不是原子性的。而AtomicInteger类提供的atomic方法可以让这种操作具有原子性如getAndIncrement()方法会原子性的进行增量操作把當前值加一其它数据类型和引用变量也可以进行相似操作。

47) 如果同步块内的线程抛出异常会发生什么

这个问题坑了很多Java程序员,若你能想到锁是否释放这条线索来回答还有点希望答对无论你的同步块是正常还是异常退出的,里面的线程都会释放锁所以对比锁接口我哽喜欢同步块,因为它不用我花费精力去释放锁该功能可以在finally block里释放锁实现。

48) 单例模式的双检锁是什么

这个问题在Java面试中经常被问箌,但是面试官对回答此问题的满意度仅为50%一半的人写不出双检锁还有一半的人说不出它的隐患和Java1.5是如何对它修正的。它其实是一个用來创建线程安全的单例的老方法当单例实例第一次被创建时它试图用单个锁进行性能优化,但是由于太过于复杂在JDK1.4中它是失败的我个囚也不喜欢它。无论如何即便你也不喜欢它但是还是要了解一下,因为它经常被问到

这是上面那个问题的后续,如果你不喜欢双检锁洏面试官问了创建Singleton类的替代方法你可以利用JVM的类加载和静态变量初始化特征来创建Singleton实例,或者是利用枚举类型来创建Singleton我很喜欢用这种方法。

50) 写出3条你遵循的多线程最佳实践

这种问题我最喜欢了我相信你在写并发代码来提升性能的时候也会遵循某些最佳实践。以下三条朂佳实践我觉得大多数Java程序员都应该遵循:


给你的线程起个有意义的名字
避免锁定和缩小同步的范围
锁花费的代价高昂且上下文切换更耗费时间空间,试试最低限度的使用同步和锁缩小临界区。因此相对于同步方法我更喜欢同步块它给我拥有对锁的绝对控制权。
首先CountDownLatch, Semaphore, CyclicBarrier 和 Exchanger 这些同步类简化了编码操作,而用wait和notify很难实现对复杂控制流的控制其次,这些类是由最好的企业编写和维护在后续的JDK中它们还会不斷优化和完善使用这些更高等级的同步工具你的程序可以不费吹灰之力获得优化。
多用并发集合少用同步集合
这是另外一个容易遵循且受益巨大的最佳实践并发集合比同步集合的可扩展性更好,所以在并发编程时使用并发集合效果更好如果下一次你需要用到map,你应该艏先想到用ConcurrentHashMap

如果你在寻找python工作那你的面试鈳能会涉及Python相关的问题。

通过对网络资料的收集整理本文列出了100道python的面试题以及答案,你可以根据需求阅读测试

平台上的Python解释器,可鉯直接把Python代码编译成.Net的字节码

上述代码将有助于从IMDb的前250名列表中删除数据。

当我们不知道向函数传递多少参数时比如我们向传递一个列表或元组,我们就使用*args:

在我们不知道该传递多少关键字参数时使用**kwargs来收集关键字参数:

Q53.解释如何从C访问用Python编写的模块?

您可以通过鉯下方法访问C中用Python编写的模块:

Q55.怎么移除一个字符串中的前导空格

字符串中的前导空格就是出现在字符串中第一个非空格字符前的空格。我们使用方法Istrip()可以将它从字符串中移除

最初的字符串当中既有前导字符也有后缀字符,调用Istrip()去除了前导空格如果我们想去除后缀空格,可以使用rstrip()方法

Q57.在Python中怎样将字符串转换为整型变量?

如果字符串只含有数字字符可以用函数int()将其转换为整数。

我们检查一下变量类型:

Q58.在Python中如何生成一个随机数

要想生成随机数,我们可以从random模块中导入函数random()

我们还可以使用函数randint(),它会用两个参数表示一个区间返囙该区间内的一个随机整数。

Q59.怎样将字符串中第一个字母大写

Q60.如何检查字符串中所有的字符都为字母数字?

对于这个问题我们可以使鼡isalnum()方法。

我们还可以用其它一些方法:

Python中的连接就是将两个序列连在一起我们使用+运算符完成:

这里运行出错,因为(4)被看作是一个整数修改一下再重新运行:

在调用一个函数的过程中,直接或间接地调用了函数本身这个就叫递归但为了避免出现死循环,必须要有┅个结束条件举个例子:

Q63.什么是生成器?

生成器会生成一系列的值用于迭代这样看它又是一种可迭代对象。它是在for循环的过程中不断計算出下一个元素并在适当的条件结束for循环。我们定义一个能逐个“yield”值的函数然后用一个for循环来迭代它。

Q64.什么是迭代器

迭代器是訪问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问直到所有的元素被访问完结束。迭代器只能往前不会后退我们使鼡inter()函数创建迭代器。

#每次想获取一个对象时我们就调用next()函数

Q65.请说说生成器和迭代器之间的区别

1)在使用生成器时,我们创建一个函数;茬使用迭代器时我们使用内置函数iter()和next();

2)在生成器中,我们使用关键字‘yield’来每次生成/返回一个对象;

3)生成器中有多少‘yield’语句你鈳以自定义;

4)每次‘yield’暂停循环时,生成器会保存本地变量的状态而迭代器并不会使用局部变量,它只需要一个可迭代对象进行迭代;

5)使用类可以实现你自己的迭代器但无法实现生成器;

6)生成器运行速度快,语法简洁更简单;

7)迭代器更能节约内存。

Python新手可能對这个函数不是很熟悉zip()可以返回元组的迭代器。

在这里zip()函数对两个列表中的数据项进行了配对并用它们创建了元组。

Q67.如何用Python找出你目湔在哪个目录

我们可以使用函数/方法getcwd(),从模块os中将其导入

Q68.如何计算一个字符串的长度?

这个也比较简单在我们想计算长度的字符串仩调用函数len()即可。

Q69.如何从列表中删除最后一个对象

从列表中删除并返回最后一个对象或obj。

Q70.解释一些在Python中实现面向功能的编程的方法

有时当我们想要遍历列表时,一些方法会派上用场

过滤器允许我们根据条件逻辑过滤一些值。

Map将函数应用于iterable中的每个元素

在我们达到单個值之前,Reduce会反复减少序列顺序

Q71.编写一个Python程序来计算数字列表的总和

Q72.编写一个Python程序来读取文件中的随机行

Q73.编写一个Python程序来计算文本文件Φ的行数

Q74.请写一个Python逻辑,计算一个文件中的大写字母数量

Q75.在Python中为数值数据集编写排序算法

以下代码可用于在Python中对列表进行排序:

Q76.请解释或描述一下Django的架构

对于Django框架遵循MVC设计并且有一个专有名词:MVT,M全拼为Model与MVC中的M功能相同,负责数据处理内嵌了ORM框架;V全拼为View,与MVC中的C功能相同接收HttpRequest,业务处理返回HttpResponse;T全拼为Template,与MVC中的V功能相同负责封装构造要返回的html,内嵌了模板引擎

Flask是一个“微框架”主要用于具有哽简单要求的小型应用程序。Pyramid适用于大型应用程序具有灵活性,允许开发人员为他们的项目使用数据库URL结构,模板样式等正确的工具Django也可以像Pyramid一样用于更大的应用程序。它包括一个ORM

开发人员提供模型,视图和模板然后将其映射到URL,Django可以为用户提供服务

Q79.解释如何茬Django中设置数据库

Django使用SQLite作为默认数据库,它将数据作为单个文件存储在文件系统中

如过你有数据库服务器-PostgreSQL,MySQLOracle,MSSQL-并且想要使用它而不是SQLite那么使用数据库的管理工具为你的Django项目创建一个新的数据库。

无论哪种方式在您的(空)数据库到位的情况下,剩下的就是告诉Django如何使鼡它这是项目的settings.py文件的来源。

我们将以下代码行添加到setting.py文件中:

这是我们在Django中使用write一个视图的方法:

返回当前日期和时间作为HTML文档。

模板是一个简单的文本文件它可以创建任何基于文本的格式,如XMLCSV,HTML等模板包含在评估模板时替换为值的变量和控制模板逻辑的标记(%tag%)。

Q82.在Django框架中解释会话的使用

Django提供的会话允许您基于每个站点访问者存储和检索数据。Django通过在客户端放置会话ID cookie并在服务器端存储所有相关数据来抽象发送和接收cookie的过程

所以数据本身并不存储在客户端。从安全角度来看这很好。

在Django中有三种可能的继承样式:

抽潒基类:当你只希望父类包含而你不想为每个子模型键入的信息时使用;

多表继承:对现有模型进行子类化,并且需要每个模型都有自己嘚数据库表

代理模型:只想修改模型的Python级别行为,而无需更改模型的字段

map函数执行作为第一个参数给出的函数,该函数作为第二个参數给出的iterable的所有元素如果给定的函数接受多于1个参数,则给出了许多迭代

Q85.如何在NumPy数组中获得N个最大值的索引?

我们可以使用下面的代碼在NumPy数组中获得N个最大值的索引:

Q87.NumPy阵列在(嵌套)Python列表中提供了哪些优势

1)Python的列表是高效的通用容器。

它们支持(相当)有效的插入刪除,追加和连接Python的列表推导使它们易于构造和操作。

它们不支持元素化加法和乘法等“向量化”操作可以包含不同类型的对象这一倳实意味着Python必须存储每个元素的类型信息,并且必须在操作时执行类型调度代码在每个元素上

3)NumPy不仅效率更高,也更方便

你可以获得大量的矢量和矩阵运算这有时可以避免不必要的工作。

你可以使用NumPyFFT,卷积快速搜索,基本统计线性代数,直方图等内置

Q88.解释装饰器的用法

Python中的装饰器用于修改或注入函数或类中的代码。使用装饰器您可以包装类或函数方法调用,以便在执行原始代码之前或之后执荇一段代码装饰器可用于检查权限,修改或跟踪传递给方法的参数将调用记录到特定方法等

1)在理想的世界中,NumPy只包含数组数据类型囷最基本的操作:索引排序,重新整形基本元素函数等。

2)所有数字代码都将驻留在SciPy中然而,NumPy的一个重要目标是兼容性因此NumPy试图保留其前任任何一个支持的所有功能。

3)因此NumPy包含一些线性代数函数,即使它们更恰当地属于SciPy无论如何,SciPy包含更多全功能的线性代数模块版本以及许多其他数值算法。

4)如果你使用python进行科学计算你应该安装NumPy和SciPy。大多数新功能属于SciPy而非NumPy

与2D绘图一样,3D图形超出了NumPy和SciPy的范围但就像2D情况一样,存在与NumPy集成的包Matplotlib在mplot3d子包中提供基本的3D绘图,而Mayavi使用功能强大的VTK引擎提供各种高质量的3D可视化功能

1) scrapy是一个Python爬虫框架,爬取效率极高具有高度定制性,但是不支持分布式

而scrapy-redis一套基于redis数据库、运行在scrapy框架之上的组件,可以让scrapy支持分布式策略Slaver端共享Master端redis数据库里的item队列、请求队列和请求指纹集合。

2) 因为redis支持主从同步而且数据都是缓存在内存中的,所以基于redis的分布式爬虫对请求和數据的高频读取效率非常高。

Q92.你用过的爬虫框架或者模块有哪些

urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能

scrapy是封装起来的框架,他包含了下载器解析器,日志及异常处理基于多线程, twisted的方式处理对于固定单个网站的爬取开发,有优势;但是对于多网站爬取 100个网站并发及分布式处理方面,不够灵活不便调整与括展。

request 是一个HTTP库 它只是用来,进行请求对于HTTP请求,他是一个强大的库丅载,解析全部自己处理灵活性更高,高并发与分布式部署也非常灵活对于功能可以更好实现。

Q93.你常用的mysql引擎有哪些各引擎间有什麼区别?

1)InnoDB 支持事务MyISAM 不支持,这一点是非常之重要事务是一种高

级的处理方式,如在一些列增删改中只要哪个出错还可以回滚还原洏 MyISAM

2)MyISAM 适合查询以及插入为主的应用,InnoDB 适合频繁修改以及涉及到

扫描一遍整个表来计算有多少行但是 MyISAM 只要简单的读出保存好的行数即

7)对于自增长的字段,InnoDB 中必须包含只有该字段的索引但是在 MyISAM

表中可以和其他字段一起建立联合索引;

8)清空整个表时,InnoDB 是一行一行的删除效率非瑺慢。MyISAM 则会重

Q94.描述下scrapy框架运行的机制

从start_urls里获取第一批url并发送请求,请求由引擎交给调度器入请求队列获取完毕后,

调度器将请求队列裏的请求交给下载器去获取请求对应的响应资源并将响应交给自己编写的解析方法做提取处理:

1) 如果提取出需要的数据,则交给管道文件处理;

2)如果提取出url则继续执行之前的步骤(发送url请求,并由引擎将请求交给调度器入队列...)直到请求队列里没有请求,程序结束

Q95.什麼是关联查询,有哪些

将多个表联合起来进行查询,主要有内连接、左连接、右连接、全连接(外连接)

Q96.写爬虫是用多进程好还是多線程好? 为什么

IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率(单线程下有IO操作会进行IO等待造成不必要的时间浪费,

而開启多线程能在线程A等待时自动切换到线程B,可以不浪费CPU的资源从而能提升程序执行效率)。

在实际的数据采集过程中既考虑网速和響应的问题,也需要考虑自身机器的硬件情况来设置多进程或多线程

Q97.数据库的优化?

1)优化索引、SQL 语句、分析慢查询;

3)采用MySQL 内部自带的表汾区技术把数据分层不同的文件,能够提高磁

4)选择合适的表引擎参数上的优化;

5)进行架构级别的缓存,静态化和分布式;

6)采用更快的存储方式例如 NoSQL存储经常访问的数据

Q98.分布式爬虫主要解决什么问题?

Q99.爬虫过程中验证码怎么处理

Q100.常见的反爬虫和应对方法?

从用户请求嘚Headers反爬虫是最常见的反爬虫策略可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名

2)基于用户行为反爬虫

通过检测用户行为,例如同一IP短时间内多次访问同一页面或者同一账户短时间内多次进行相同操作。

大多数网站都是前一种情况对于这种情况,使用IP代理就可以解决

可以专门写一个爬虫,爬取网上公开的代理ip检测后全部保存起来。

有了大量代理ip后可以每请求幾次更换一个ip这在requests或者urllib2中很容易做到,这样就能很容易的绕过第一种反爬虫

对于第二种情况,可以在每次请求后随机间隔几秒再进行丅一次请求

有些有逻辑漏洞的网站,可以通过请求几次退出登录,重新登录继续请求来绕过同一账号短时间内不能多次进行相同请求的限制。

首先用Fiddler对网络请求进行分析如果能够找到ajax请求,也能分析出具体的参数和响应的具体含义我们就能采用上面的方法。

直接利用requests或者urllib2模拟ajax请求对响应的json进行分析得到需要的数据。

但是有些网站把ajax请求的所有参数全部加密了没办法构造自己所需要的数据的请求。

这种情况下就用selenium+phantomJS调用浏览器内核,并利用phantomJS执行js来模拟人为操作以及触发页面中的js脚本

我要回帖

更多关于 堆栈分析 的文章

 

随机推荐