当前位置:网站首页>字符串split操作到底有多少坑
字符串split操作到底有多少坑
2022-07-22 10:44:00 【程序猿洞晓】
长字符串切分,取其中元素封装或者将封装信息组合成长字符串都是常规操作,但是这种长字符串往往是不可控的,如一个长字符串就是由一个元素组成,或者存在空字符串的元素,看似这并没有什么问题,但是使用不同工具类的split
方法进行切分结果是完全不同的。不知道你是否遇到这样的坑,下面一起来看看。
String类自带的split方法
直接使用String本身自带的split
方法,看对不同字符串的切分结果。
没有分隔符的字符串
//str = "1" public static void split2(String str) { String[] splits = str.split(","); for (String split : splits) { System.out.println("->" + split); } System.out.println("数组长度:" + splits.length); }
切分后结果是单个元素
["1"]
,数组长度是1。有分隔符,分隔符切分后没有空字符串出现
//str = "1,2" //代码同上……
切分后结果是
["1","2"]
,数组长度是2。(假设分隔符是n个,分割后的元素个数是n+1个)有分隔符,分隔符切分后有空字符串出现
//str = "1,,2" //代码同上……
切分后结果是
["1","","2"]
,数组长度是3。(假设分隔符是n个,分割后的元素个数是n+1个)
最终总结不管分隔符有多少个,最终切分的结果都是n+1个元素。也是正常业务逻辑所需要的。但是这里有一个问题,如果传入的字符串是null
的时候会报NullPointException
异常,需要另外加一层非空判断。
commons提供的StringUtils工具类
具体全限定类名是org.apache.commons.lang3.StringUtils
,这个可以说是最常用一个字符串的工具类。如判断非null
、非空字符串或者非空格,用isNotBlank
方法,使用集合元素组装字符串,用join
方法等等。现在来看一下split
方法在不同的情况下是如何实现。
没有分隔符的字符串
//str = "1" public static void split1(String str) { String[] splits = org.apache.commons.lang3.StringUtils.split(str, ","); for (String split : splits) { System.out.println("->" + split); } System.out.println("数组长度:" + splits.length); }
切分后的结果是单个元素
["1"]
,数组长度为1。有分隔符,分隔符切分后没有空字符串出现
//str = "1,2" //代码同上……
切分后的结果是两个元素
["1","2"]
,数组长度为2。有分隔符,分隔符切分后有空字符串出现
//str = "1,,2" //代码同上……
切分后的结果和上一种情况结果是一样的,也是两个元素
["1","2"]
,数组长度为2。
从这里就可以看的出来问题的所在,当出现空字符串的时候,会自动将空字符串丢弃,只保留非空字符串。但是这里还是需要注意的是如果是空格,也会形成一个元素。比如现在str输入的是"1, ,2"
,两个分隔符间有一个空格,此时就会切分成三个元素。
org.apache.commons.lang3.StringUtils
还是很强大的,在切分上split有10种方法左右,如可以按照驼峰规则切分等。基本想要的切分场景都有的。所以就个人使用StringUtils来说,首选是commons.lang3
下的。
Spring下util包提供的StringUtils工具类
全限定类名org.springframework.util.StringUtils
,这个StringUtils也经常被用到,因为在输入StringUtils的时候,IDEA自动提示,往往它就是在第一位。那它和上面两种在split
方法上有什么不同呢?
没有分隔符的字符串
//str = "1" public static void split3(String str) { String[] splits = org.springframework.util.StringUtils.split(str, ","); for (String split : splits) { System.out.println("->" + split); } System.out.println("数组长度:" + splits.length); }
这个时候对不起,会报
NullPointerException
异常,也就是这个split
方法必须要有分隔符的存在。有分隔符,分隔符切分后没有空字符串出现
//str = "1,2" //代码同上……
切分后的结果是两个元素
["1","2"]
,数组长度为2。有分隔符,分隔符切分后有空字符串出现
//str = "1,,2" //代码同上……
切分后的结果是两个元素
["1",",2"]
,数组长度为2。看到这里可能你会认为我这个数组格式写错了,但是实际上第二个元素的确是这样的,确定无疑。
这个split
方法还是很坑的,它会从字符串中找分隔符是否存在,如果不存在直接报错,如果存在,不管有多少个分隔符,都是以第一个分隔符做切分,最终形成两个元素。
总结
三个split
方法三种不同的切分逻辑,到底在什么时候用那种方式切分就很讲究了,因为在开发过程中因为这个切分出过很多莫名其妙的BUG。我就遇到过两次。
- 第一次是使用的
org.apache.commons.lang3.StringUtils
来切分字符串,字符串内有空字符串存在,导致切割后的元素个数和实际个数不同,准确的来说少了元素,结果代码中在向另一个字符串占位符中填充数据的时候,总是出现错位的现象。(如本来应该放在占位符3位置上的字符串出现为空字符串,在切分的时候,3位置的元素实际被抛弃,4位置的元素放在了3的位置) - 第二次也是使用的
org.apache.commons.lang3.StringUtils
来切分字符串,测试一直都是很正常,但是测试一段时间后,发现报NullPointException
,排查后才发现,引入的StringUtils被其他开发人员换成了org.springframework.util.StringUtils
导致的。因为这个字符串可能没有分隔符。
边栏推荐
- [FPGA]: IP core --ddr3
- 7-1 fake news (20 points)
- 【FPGA】:ip核--rapid io
- 电荷分级DAC中二元加权电容器的寄生感知大小和详细路由
- Pytorch中 类Parameter的解析,类内成员函数.parameters()的源码分析,参数集合的获取,参数的注册赋值源码分析
- 1064 complete binary search tree (30 points)
- Chain stack implementation (C language)
- Stack implementation (C language)
- 模拟QQ登陆界面
- Parasitic sensing size and detailed routing of binary weighted capacitors in charge graded DAC
猜你喜欢
随机推荐
Modify the size of qtcreator interface
【FPGA】:ip核--DDR3
New attribute of class (elementary understanding)
Automatic current mirror layout (acml) tool
Latex在VSCODE中编译报错`Recipe terminated with error. Retry building the project.
1053 path of equal weight (30 points)
【面试:基础篇01:整数二分查找】
7-2 rank a linked list (25 points)
鏈棧實現(C語言)
【FPGA】:aurora核的使用
Hill sort (minimum incremental sort)
selenium测试框架快速搭建(ui自动化测试)
1091 acute stroke (30 points)
弱网测试(Charles模拟)
1072 gas station (30 points)
Common centroid layout of active and passive equipment: review and future road
VSCODE 比较两个文件
1038 recover the smallest number (30 points)
Leetcode high frequency question: what is the difference between the combat effectiveness of the two soldiers with the closest combat effectiveness of N soldiers in the challenge arena
信号耦合约束下扭曲共质心电容器阵列的布线能力