JavaSE-集合
Java基础集合分为两大类,Collection和Map,前者单列集合,后者双列集合。
Collection
下图为Collection集合体系树
Collection下有List和Set两小类集合,List和Set都只是接口。
List的具体实现有ArrayList和LinkedList,Set的具体实现有HashSet,LinkedHashSet,TreeSet。
它们的特点如下表
|——|—————|————|
| | | |
| List | ArrayList | 有序,可重复,有索引 |
| List | LinkedList | 有序,可重复,有索引 |
| Set | HashSet | 无序,不重复,无索引 |
| Set | LinkedHashSet | 有序,不重复,无索引 |
| Set | TreeSet | 排序,不重复,无索引 |
Map
下图为Map集合体系树
其中具体的实现分别是HashMap,LinkedHashMap,TreeMap,特点如下表|—–|—————|————|
| | | |
| Map | HashMap | 无序,不重复,无索引 |
| Map | LinkedHashMap | 有序,不重复,无索引 |
| Map | TreeMap | 排序,不重复,无索引 |
需要注意的是Map的”序”都是基于Key的
性能
ArrayList
ArrayList行为和数组无异,插入删除会设计复制覆盖,性能不高,但是因为索引所以涉及索引的操作性能格外的好,比如读取,末尾增删改。同时内存占用很小,除了数据本身没有太多其他的东西。
LinkedList
LinkedList在ArrayList基础上,使用”链”链接前后元素,取缔了ArrayList因为复制覆盖造成的低效行为,在增删改性能都很好,但是因为使用了链所以数据在内存中不是连续的,故而失去了索引一步读取的优势,需要遍历才能锁定元素,因此涉及索引的操作都受到一定性能下滑。内存占用比ArrayList多了”链”。
请使用Iterator迭代器,通过Iterator迭代List永远是效率最高的
1 | List<String> list = new ArrayList<String>(); |
HashSet
HashSet是基于哈希表实现的,哈希表是一种增删改查性能都较好的数据结构
目前的(jdk8+)哈希表是基于数组+链表+红黑树实现的。
我们可以肯定LinkedList的链能够一步增删元素的优势,但是却没法一步定位到元素,但是Hash可以逼近,Hash将元素的哈希值取余后的到的结果作为索引放入数组对应位置,如果多个元素位置相同就用链连接,这就是哈希表的雏形=数组+链表,虽然看起来漏洞百出。使用哈希表定位元素只需对哈希值取余得到索引,锁定数组位置,然后遍历链表,锁定元素。只需要保证哈希表取余和遍历都不会花上太多时间,那么哈希表在锁定元素上就也是成功的。
庆幸的是,哈希表的取余操作十分高效,这得益于它的设计,哈希表的数组长度保持为2的幂,用二进制数表示就是一个1+多个0,比如10=2,100=4,1000=8,那么对于随便一个二进制数,和这个2幂进行”按位与”运算就可以得到余数的二进制数。
如果我们保证一个数组位置上的元素不会太多,那么遍历链表也是开销极小的。哈希表默认的加载因子为0.75,意味着元素数超过数组长度*0.75时,哈希表会进行扩容,也就是将数组长度*2 ,这就保证了一个数组位置上的链表不会太长。此时又会产生一个问题,扩容后所有元素都需要重新取余计算位置吗?不用,哈希表也有巧妙的办法,基本上只需要移动一半的元素就可以。
同时,在红黑树的加持下,如果太过幸运,数组某位置上的链表过长(>8),那么哈希表会把这个链表变成红黑树,进一步为遍历加速。
因此,HashSet的性能是均衡地较好。
LinkedHashSet
就是在HashSet的基础上,给元素间加上了链,确定了它们的顺序。
TreeSet
底层不是哈希表了,而是红黑树,一种自平衡二叉树。性能感觉起来是更优雅的均衡较好。
随着元素数量增加,二叉树优势越为明显,如果数组+链表的结构能在低量元素时能比红黑树快,那么哈希表就比单纯的红黑树快。
Map
Map和Set是一样的,更准确地说,Set底层用的就是Map,忽略了value只保留key而已。
其他问题
HashSet不能对内容一样的两个不同对象去重,为什么?怎么办?
比如自定义Student类
1 | public class Student { |
1 | Student s1 = new Student("张三", 22, 189.5); |
因为第一,哈希表需要对象的哈希值确定位置,而hashCode()默认是地址的比较,两个不同对象地址明显不同,使用哈希表会错误地把两个对象也放进去。解决办法是重写对象地hashCode()方法。
因为第二,如果两个对象hashCode()一致,在数组同一位置,此时会进行equals比较,如果是false,后者就会当作新元素。解决办法就是重写equals方法。
在Java中==对基本数据类型是值的比较,对对象是地址比较。
equals方法(一般不对基本数据类型比较),对对象是地址比较,但是对象的equals方法可以重写。这很常见,就像String一样是重写过的,使用equals实际上是在对值进行比较。
所以想要去重,就要重写对象的hashCode和equals方法。
idea可以快捷插入hashCode和equals,默认是值一样就相等。
1 |
|
如果TreeSet的键是自定义对象,怎么定义排序规则?
两个办法
- Student类继承Comparable接口,重写compareTo方法
1 | public class Student implements Comparable<Student> { |
- 使用TreeSet时提供参数构造器的Comparator
1 | Set<Student> set2 = new TreeSet<>(new Comparator<Student>() { |
1 | Set<Student> set2 = new TreeSet<>((o1, o2)->{ |