String转换成Integer源码分析

/ 语言 / 1 条评论 / 2834浏览

我们经常为用到Integer.valueOf(String str)这个方法,如果字符串格式不对,这个方法会抛出一个系统异常NumberFormatException 这里我们就要分析一下这个方法,其中Byte,Short也是调用了Ingeter中的方法. 在Integer类中的定义如下:

public static Integer valueOf(String s) throws NumberFormatException
    {
 return new Integer(parseInt(s, 10));
    }

这里因为parseInt方法返回的int型的,这里调用了一个构造函数产生了一个新的Integer实例. 这里关心的是parseInt方法,该方法代码如下:

public static int parseInt(String s, int radix)
  throws NumberFormatException
    {
        if (s == null) {
            throw new NumberFormatException("null");
        }

 if (radix < Character.MIN_RADIX) {
     throw new NumberFormatException("radix " + radix +
         " less than Character.MIN_RADIX");
 }

 if (radix > Character.MAX_RADIX) {
     throw new NumberFormatException("radix " + radix +
         " greater than Character.MAX_RADIX");
 }

 int result = 0;
 boolean negative = false;
 int i = 0, max = s.length();
 int limit;
 int multmin;
 int digit;

 if (max > 0) {
     if (s.charAt(0) == '-') {
  negative = true;
  limit = Integer.MIN_VALUE;
  i++;
     } else {
  limit = -Integer.MAX_VALUE;
     }

     if (i < max) {
  digit = Character.digit(s.charAt(i++),radix);
  if (digit < 0) {
      throw NumberFormatException.forInputString(s);
  } else {
      result = -digit;
  }
     }
     while (i < max) {
  // Accumulating negatively avoids surprises near MAX_VALUE
  digit = Character.digit(s.charAt(i++),radix);
  if (digit < 0) {
      throw NumberFormatException.forInputString(s); 
  }
  if (result < multmin) {
      throw NumberFormatException.forInputString(s);  异常1
  }
  result *= radix;
  if (result < limit + digit) {
      throw NumberFormatException.forInputString(s);  异常2
  }
  result -= digit;
     }
 } else {
     throw NumberFormatException.forInputString(s);
 }

 if (negative) {
     if (i > 1) {
  return result;
     } else { /* Only got "-" */
  throw NumberFormatException.forInputString(s);
     }
 } else {
     return -result;
 }
    }

很显然,该方法的第二个参数表示是基数(最常用的是十进制,还有十六机制,八进制等等).

如果字符串是空指针,直接抛出异常.

如果基础小于2或者大于36的话,抛出异常(这种情况一般不会出现,因为我们用的最多就是十进制的了).

如果是空字符串,也抛出异常,也就是max=0的情况了.

我们来关注下面的转换过程:

这里使用了Character中的静态方法digit,这个方法比较复杂,这里先说明它的功能:对于给定的基数,如果是合法的字符(可以转化为数字),返回该数字值,否则返回-1.比如digit('3',10)返回3,digit('a',10)返回-1.

这段程序看起来很简单,其实还真不容易看懂,这里先说明几个局部变量的含义吧:

result:记录返回值

negative:符号标志

i:字符串位置

s:字符串长度

limit:界限

multmin:也是一个界限

digit:当前字符表示的数字

先看第一个字符是否是'-'号,设定符号标志negative和极限值limit.

注意到limit一定是一个负值.

处理最高位,这里result保存的是负值,这样就可以对正负数统一处理.

关键就是这个while循环了,第一个if不用解释了,肯定是因为非法字符.

第二个if语句的含义:如果result小于multmin,会产生什么结果呢?

是不是一定会溢出呢?假设不会溢出,就是说结果必须>=limit.

result小于multmin,result至少应该位multmin-1,后面有 result=result*radix=(multmin-1)radix=multminradix-radix

该值肯定小于limit,其中multmin=limit/radix,注意这里都是负数.

所以假设不成里,如果result小于multmin的话,后面一定会溢出.

如果这里没有判断的话,溢出就麻烦了,正数也会变负数了.

第三个if语句的含义:在这条语句以前肯定没有溢出,但是有可能加上最后一位digit就溢出了,所以这个判断也是必要的.

后面的就比较好理解了,else是表示空字符串"".

如果是负数的还要看是否长度是1,就只是一个'-'号的情况.

如果是正数的话返回相反数就可以了.

这里有好多地方都有可能抛出异常,只要看明白了程序就知道这个异常是 那条语句抛出的了,这里考虑溢出异常:异常1和异常2.

Ingeter.Max_VALUE=2147483647

下面的两条语句在不同的地方抛出异常.

Ingeter.valueOf("2147483648");这个在异常2抛出的.

Ingeter.valueOf("21474836471");这个在异常1抛出的.

这里简单的分析了String转化为Ingeter的过程,其实整个Ingeter类也就主要是这个方法了,Byte和Short都是调用这个方法的. 看看Byte的代码:

public static byte parseByte(String s, int radix)
 throws NumberFormatException {
 int i = Integer.parseInt(s, radix);
 if (i < MIN_VALUE || i > MAX_VALUE)
     throw new NumberFormatException(
                "Value out of range. Value:/"" + s + "/" Radix:" + radix);
 return (byte)i;
   }

了解这个方法后就再也不会为Integer.valueOf()产生的异常感到意外了,特别是在JSP中,因为参数都是String型的,转换的时候动不动就出现异

常,你该知道怎么回事了吧.

  1. 鼠标点击特效不错

    回复