哪些要求容易被我忽略,而导致全部或部分论坛内容收录失败?
1.标签中必须提供完整的相关内容,请不要省略部分内容,也不要增加不相关的内容。
2.标签中的所有内容如URL、标题等,若包含以下特殊符号如“&”“<”“>”等,需要根据XML规范进行转义;这些特殊符号仅针对半角符号而言,全角符号无需进行转义。
3.字符编码必须严格符合XML声明中的规范,例如XML声明为<?xml version="1.0" encoding="GB2312" ?>,若不完全是标准GB2312规范的编码,会导致部分数据丢失。