采集JSON解析错误的修复

两段采集来的JSON格式:

一:

复制代码
{"hwgOnlineId":"554312", "jiwuChatId":"", "phoneCategoryId":"20006", "cuxiaoSeq":{voucherTitle:1,lh

二:

复制代码
{"pic":"//imgservice.suning.cn/uimg1/b2c/image/rX4cM65dyr_4kndNFwLEgA.jpg_400w_400h_4e",
	 "itemDomain":"//"+document.location.hostname,
	 "resRoot":"//script.suning.cn/project/pdsWeb",
	 "shopCount":1,
	 "sslStoreCode":"",
	 "addCartNumLimit":"199",
	 "favoriteStatusSwitch":"1" == "1",
	 "thirdEVoucherFlag":"",
	 "specialSSLFlag":"",
	 "sslLabelText" : "苏宁服务"}

直接使用PHP的json_decode报错

解决思路:

1、手动格式化,将所有","换行

2、半分法删除内容定位报错的代码行

3、找到问题行后过滤格式处理

4、对于json格式中掺杂了javascript代码的情况还可以直接使用v8js引擎处理

解决方案一(修复格式):

复制代码
$str = file_get_contents('test.txt');
 
$str = preg_replace('@/\*[^/]+\*/@isU','',$str);
 
$str = str_replace('"+document.location.hostname','"',$str);
 
$str = str_replace('"1" == "1"','true',$str);
 
$json = json_decode($str);
 
if(!$json) $json = json2array($str);
 
var_dump(getJsJSON($json));

解决方案二(使用PHP-V8JS扩展):

复制代码
//以JavaScript环境执行JS
function getJsJSON($str){
    $v8 = new V8Js();
    $func = "
        function getJsJSON(str){
         document ={location:{hostname:''}}
         a={$str}
         return JSON.stringify(a);
        }
        b = getJsJSON()
   ";
 
   try {
        //传递参数给js
        // $v8->str = $str;
        //执行js
        $code = $v8->executeString($func);
        //清空对象,垃圾回收。
        unset($v8);
    } catch (V8JsScriptException $e) {        
         dump($e->getMessage());
         dump($e->getJsSourceLine());
         dump($e->getJsTrace());
         // dump($e);
      }
    if($code)$code=json_decode($code,true);  
    return $code;
}
 
 
$js = file_get_contents('test.txt');
var_dump(getJsJSON($js));

o0b.cn/ibrad
相关推荐
不会C语言的男孩38 分钟前
C++ Primer 第3章:字符串、向量和数组
开发语言·c++
兰令水40 分钟前
leecodecode【反前后指针】【2026.5.31打卡-java版本】
java·开发语言
Dovis(誓平步青云)2 小时前
《QT学习第四篇:常见事件与UDP、TCP、文件系统、(锁、信号量、条件变量》
c语言·开发语言·汇编·qt
isyangli_blog10 小时前
OpenDayLight (Carbon 版本) 启动与组件安装
开发语言·php
vb20081110 小时前
FastAPI APIRouter
开发语言·python
Benszen10 小时前
KVM虚拟化解决方案
开发语言·perl
会编程的土豆10 小时前
Go 语言反射(Reflection)详解
开发语言·后端·golang
東雪木10 小时前
多线程与并发编程 专属复习笔记
java·开发语言·笔记·java面试
杨充11 小时前
1.3 浮点型数据设计灵魂
开发语言·python·算法
噜噜噜阿鲁~11 小时前
python学习笔记 | 11.3、面向对象高级编程-多重继承
java·开发语言