JavSP/JavSP.py at master · RufusExE/JavSP

History

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

384

385

386

387

388

389

390

391

392

393

394

395

396

397

398

399

400

401

402

403

404

405

406

407

408

409

410

411

412

413

414

415

416

417

418

419

420

421

422

423

424

425

426

427

428

429

430

431

432

433

434

435

436

437

438

439

440

441

442

443

444

445

446

447

448

449

450

451

452

453

454

455

456

457

458

459

460

461

462

463

464

465

466

467

468

469

470

471

472

473

474

475

476

477

478

479

480

481

482

483

484

485

486

487

488

489

490

491

492

493

494

495

496

497

498

499

500

501

502

503

504

505

506

507

508

509

510

511

512

513

514

515

516

517

518

519

520

521

522

523

524

525

526

527

528

529

530

531

532

533

534

535

536

537

538

539

540

541

542

543

544

545

546

547

548

549

550

551

552

553

554

555

556

557

558

559

560

561

562

563

564

565

566

567

568

569

570

571

572

573

574

575

576

577

578

579

580

581

582

583

584

585

586

587

588

589

590

591

592

593

594

595

596

597

598

599

600

601

602

603

604

605

606

607

608

609

610

611

612

613

614

615

616

617

618

619

620

621

622

623

624

625

626

627

628

629

630

631

632

633

634

635

636

637

638

639

640

641

642

643

644

645

646

647

648

649

650

651

652

653

654

655

656

657

658

659

660

661

662

663

664

665

666

667

668

669

670

671

672

673

674

675

676

677

678

679

680

681

682

import os

import re

import sys

import json

import time

import logging

import requests

import threading

from shutil import copyfile

from typing import Dict, List

sys.stdout.reconfigure(encoding='utf-8')

import colorama

import pretty_errors

from colorama import Fore, Style

from tqdm import tqdm

pretty_errors.configure(display_link=True)

from core.print import TqdmOut

# 将StreamHandler的stream修改为TqdmOut，以与Tqdm协同工作

root_logger = logging.getLogger()

for handler in root_logger.handlers:

if type(handler) == logging.StreamHandler:

handler.stream = TqdmOut

logger = logging.getLogger('main')

from core.lib import mei_path

from core.nfo import write_nfo

from core.config import cfg, args

from core.file import *

from core.func import *

from core.image import *

from core.datatype import Movie, MovieInfo

from web.base import download

from web.exceptions import *

from web.translate import translate_movie_info

actressAliasMap = {}

if cfg.NFO.fix_actress_name:

actressAliasFilePath = mei_path("data/actress_alias.json")

with open(actressAliasFilePath, "r", encoding="utf-8") as file:

actressAliasMap = json.load(file)

def resolve_alias(name):

"""将别名解析为固定的名字"""

for fixedName, aliases in actressAliasMap.items():

if name in aliases:

return fixedName

return name # 如果找不到别名对应的固定名字，则返回原名

def import_crawlers(cfg):

"""按配置文件的抓取器顺序将该字段转换为抓取器的函数列表"""

unknown_mods = []

for typ, cfg_str in cfg.CrawlerSelect.items():

mods = cfg_str.split(',')

if 'airav' in mods:

mods.sort(key=lambda x:x=='airav', reverse=cfg.Crawler.title__chinese_first)

valid_mods = []

for name in mods:

try:

# 导入fc2fan抓取器的前提: 配置了fc2fan的本地路径

# if name == 'fc2fan' and (not os.path.isdir(cfg.Crawler.fc2fan_local_path)):

# logger.debug('由于未配置有效的fc2fan路径，已跳过该抓取器')

# continue

import_name = 'web.' + name

__import__(import_name)

valid_mods.append(import_name) # 抓取器有效: 使用完整模块路径，便于程序实际使用

except ModuleNotFoundError:

unknown_mods.append(name) # 抓取器无效: 仅使用模块名，便于显示

cfg._sections['CrawlerSelect'][typ] = tuple(valid_mods)

if unknown_mods:

logger.warning('配置的抓取器无效: ' + ', '.join(unknown_mods))

# 爬虫是IO密集型任务，可以通过多线程提升效率

def parallel_crawler(movie: Movie, tqdm_bar=None):

"""使用多线程抓取不同网站的数据"""

def wrapper(parser, info: MovieInfo, retry):

"""对抓取器函数进行包装，便于更新提示信息和自动重试"""

crawler_name = threading.current_thread().name

task_info = f'Crawler: {crawler_name}: {info.dvdid}'

for cnt in range(retry):

try:

parser(info)

movie_id = info.dvdid or info.cid

logger.debug(f"{crawler_name}: 抓取成功: '{movie_id}': '{info.url}'")

setattr(info, 'success', True)

if isinstance(tqdm_bar, tqdm):

tqdm_bar.set_description(f'{crawler_name}: 抓取完成')

break

except MovieNotFoundError as e:

logger.debug(e)

break

except MovieDuplicateError as e:

logger.exception(e)

break

except (SiteBlocked, SitePermissionError, CredentialError) as e:

logger.error(e)

break

except requests.exceptions.RequestException as e:

logger.debug(f'{crawler_name}: 网络错误，正在重试 ({cnt+1}/{retry}): \n{repr(e)}')

if isinstance(tqdm_bar, tqdm):

tqdm_bar.set_description(f'{crawler_name}: 网络错误，正在重试')

except Exception as e:

logger.exception(e)

# 根据影片的数据源获取对应的抓取器

crawler_mods = cfg.CrawlerSelect[movie.data_src]

all_info = {i: MovieInfo(movie) for i in crawler_mods}

# 番号为cid但同时也有有效的dvdid时，也尝试使用普通模式进行抓取

if movie.data_src == 'cid' and movie.dvdid:

crawler_mods = crawler_mods + cfg.CrawlerSelect['normal']

for i in all_info.values():

i.dvdid = None

for i in cfg.CrawlerSelect['normal']:

all_info[i] = MovieInfo(movie.dvdid)

thread_pool = []

for mod, info in all_info.items():

parser = getattr(sys.modules[mod], 'parse_data')

# 将all_info中的info实例传递给parser，parser抓取完成后，info实例的值已经完成更新

# TODO: 抓取器如果带有parse_data_raw，说明它已经自行进行了重试处理，此时将重试次数设置为1

if hasattr(sys.modules[mod], 'parse_data_raw'):

th = threading.Thread(target=wrapper, name=mod, args=(parser, info, 1))

else:

th = threading.Thread(target=wrapper, name=mod, args=(parser, info, cfg.Network.retry))

th.start()

thread_pool.append(th)

# 等待所有线程结束

timeout = cfg.Network.retry * cfg.Network.timeout

for th in thread_pool:

th.join(timeout=timeout)

# 根据抓取结果更新影片类型判定

if movie.data_src == 'cid' and movie.dvdid:

titles = [all_info[i].title for i in cfg.CrawlerSelect[movie.data_src]]

if any(titles):

movie.dvdid = None

all_info = {k: v for k, v in all_info.items() if k in cfg.CrawlerSelect['cid']}

else:

logger.debug(f'自动更正影片数据源类型: {movie.dvdid} ({movie.cid}): normal')

movie.data_src = 'normal'

movie.cid = None

all_info = {k: v for k, v in all_info.items() if k not in cfg.CrawlerSelect['cid']}

# 删除抓取失败的站点对应的数据

all_info = {k:v for k,v in all_info.items() if hasattr(v, 'success')}

for info in all_info.values():

del info.success

# 删除all_info中键名中的'web.'

all_info = {k[4:]:v for k,v in all_info.items()}

return all_info

def info_summary(movie: Movie, all_info: Dict[str, MovieInfo]):

"""汇总多个来源的在线数据生成最终数据"""

final_info = MovieInfo(movie)

########## 部分字段配置了专门的选取逻辑，先处理这些字段 ##########

# genre

if 'javdb' in all_info and all_info['javdb'].genre:

final_info.genre = all_info['javdb'].genre

########## 移除所有抓取器数据中，标题尾部的女优名 ##########

if cfg.Crawler.title__remove_actor:

for name, data in all_info.items():

data.title = remove_trail_actor_in_title(data.title, data.actress)

########## 然后检查所有字段，如果某个字段还是默认值，则按照优先级选取数据 ##########

# parser直接更新了all_info中的项目，而初始all_info是按照优先级生成的，已经符合配置的优先级顺序了

# 按照优先级取出各个爬虫获取到的信息

attrs = [i for i in dir(final_info) if not i.startswith('_')]

covers, big_covers = [], []

for name, data in all_info.items():

absorbed = []

# 遍历所有属性，如果某一属性当前值为空而爬取的数据中含有该属性，则采用爬虫的属性

for attr in attrs:

incoming = getattr(data, attr)

current = getattr(final_info, attr)

if attr == 'cover':

if incoming and (incoming not in covers):

covers.append(incoming)

absorbed.append(attr)

elif attr == 'big_cover':

if incoming and (incoming not in big_covers):

big_covers.append(incoming)

absorbed.append(attr)

elif attr == 'uncensored':

if (current is None) and (incoming is not None):

setattr(final_info, attr, incoming)

absorbed.append(attr)

else:

if (not current) and (incoming):

setattr(final_info, attr, incoming)

absorbed.append(attr)

if absorbed:

logger.debug(f"从'{name}'中获取了字段: " + ' '.join(absorbed))

# 使用网站的番号作为番号

if cfg.Crawler.respect_site_avid:

id_weight = {}

for name, data in all_info.items():

if data.title:

if movie.dvdid:

id_weight.setdefault(data.dvdid, []).append(name)

else:

id_weight.setdefault(data.cid, []).append(name)

# 根据权重选择最终番号

if id_weight:

id_weight = {k:v for k, v in sorted(id_weight.items(), key=lambda x:len(x[1]), reverse=True)}

final_id = list(id_weight.keys())[0]

if movie.dvdid:

final_info.dvdid = final_id

else:

final_info.cid = final_id

# javdb封面有水印，优先采用其他站点的封面

javdb_cover = getattr(all_info.get('javdb'), 'cover', None)

if javdb_cover is not None:

if cfg.Crawler.ignore_javdb_cover == 'auto':

covers.remove(javdb_cover)

covers.append(javdb_cover)

elif cfg.getboolean('Crawler', 'ignore_javdb_cover'):

covers.remove(javdb_cover)

setattr(final_info, 'covers', covers)

setattr(final_info, 'big_covers', big_covers)

# 对cover和big_cover赋值，避免后续检查必须字段时出错

if covers:

final_info.cover = covers[0]

if big_covers:

final_info.big_cover = big_covers[0]

########## 部分字段放在最后进行检查 ##########

# 特殊的 genre

if final_info.genre is None:

final_info.genre = []

if movie.hard_sub:

final_info.genre.append('内嵌字幕')

if movie.uncensored:

final_info.genre.append('无码流出/破解')

# title

if cfg.Crawler.title__chinese_first and 'airav' in all_info:

if all_info['airav'].title and final_info.title != all_info['airav'].title:

final_info.ori_title = final_info.title

# 女优别名固定

if cfg.NFO.fix_actress_name and bool(final_info.actress_pics):

final_info.actress = [resolve_alias(i) for i in final_info.actress]

if final_info.actress_pics:

final_info.actress_pics = {

resolve_alias(key): value for key, value in final_info.actress_pics.items()

}

# 检查是否所有必需的字段都已经获得了值

for attr in cfg.Crawler.required_keys:

if not getattr(final_info, attr, None):

logger.error(f"所有抓取器均未获取到字段: '{attr}'，抓取失败")

return False

# 必需字段均已获得了值：将最终的数据附加到movie

movie.info = final_info

return True

def generate_names(movie: Movie):

"""按照模板生成相关文件的文件名"""

info = movie.info

# 准备用来填充命名模板的字典

d = {}

d['num'] = info.dvdid or info.cid

d['title'] = info.title or cfg.NamingRule.null_for_title

d['rawtitle'] = info.ori_title or d['title']

if info.actress and len(info.actress) > cfg.NamingRule.max_actress_count:

logging.debug('女优人数过多，按配置保留了其中的前n个: ' + ','.join(info.actress))

actress = info.actress[:cfg.NamingRule.max_actress_count] + ['…']

else:

actress = info.actress

d['actress'] = ','.join(actress) if actress else cfg.NamingRule.null_for_actress

d['score'] = info.score or '0'

d['censor'] = cfg.NamingRule.censorship_names[info.uncensored]

d['serial'] = info.serial or cfg.NamingRule.null_for_serial

d['director'] = info.director or cfg.NamingRule.null_for_director

d['producer'] = info.producer or cfg.NamingRule.null_for_producer

d['publisher'] = info.publisher or cfg.NamingRule.null_for_publisher

d['date'] = info.publish_date or '0000-00-00'

d['year'] = d['date'].split('-')[0]

# cid中不会出现'-'，可以直接从d['num']拆分出label

num_items = d['num'].split('-')

d['label'] = num_items[0] if len(num_items) > 1 else '---'

# 保存label供后面判断裁剪图片的方式使用

setattr(info, 'label', d['label'].upper())

# 处理字段：替换不能作为文件名的字符，移除首尾的空字符

for k, v in d.items():

d[k] = replace_illegal_chars(v.strip())

# 生成nfo文件中的影片标题

nfo_title = cfg.NamingRule.nfo_title.substitute(**d)

setattr(info, 'nfo_title', nfo_title)

# 使用字典填充模板，生成相关文件的路径（多分片影片要考虑CD-x部分）

cdx = '' if len(movie.files) <= 1 else '-CD1'

if hasattr(info, 'title_break'):

title_break = info.title_break

else:

title_break = split_by_punc(d['title'])

if hasattr(info, 'ori_title_break'):

ori_title_break = info.ori_title_break

else:

ori_title_break = split_by_punc(d['rawtitle'])

copyd = d.copy()

copyd['num'] = copyd['num'] + movie.attr_str

longest_ext = max((os.path.splitext(i)[1] for i in movie.files), key=len)

for end in range(len(ori_title_break), 0, -1):

copyd['rawtitle'] = replace_illegal_chars(''.join(ori_title_break[:end]).strip())

for sub_end in range(len(title_break), 0, -1):

copyd['title'] = replace_illegal_chars(''.join(title_break[:sub_end]).strip())

# 如果不整理文件，则保存抓取的数据到当前目录

if cfg.File.enable_file_move is False:

save_dir = os.path.dirname(movie.files[0])

filebasename = os.path.basename(movie.files[0])

ext = os.path.splitext(filebasename)[1]

basename = filebasename.replace(ext, '')

else:

save_dir = os.path.normpath(cfg.NamingRule.save_dir.substitute(copyd)).strip()

basename = os.path.normpath(cfg.NamingRule.filename.substitute(copyd).strip())

if 'universal' in cfg.NamingRule.media_servers:

long_path = os.path.join(save_dir, basename+longest_ext)

else:

long_path = os.path.join(save_dir, f'{basename}{cdx}-fanart.jpg')

remaining = get_remaining_path_len(os.path.abspath(long_path))

if remaining > 0:

movie.save_dir = save_dir

movie.basename = basename

if 'universal' in cfg.NamingRule.media_servers:

movie.nfo_file = os.path.join(save_dir, 'movie.nfo')

movie.fanart_file = os.path.join(save_dir, 'fanart.jpg')

movie.poster_file = os.path.join(save_dir, 'poster.jpg')

else:

movie.nfo_file = os.path.join(save_dir, f'{basename}{cdx}.nfo')

movie.fanart_file = os.path.join(save_dir, f'{basename}{cdx}-fanart.jpg')

movie.poster_file = os.path.join(save_dir, f'{basename}{cdx}-poster.jpg')

if d['title'] != copyd['title']:

logger.info(f"自动截短标题为:\n{copyd['title']}")

if d['rawtitle'] != copyd['rawtitle']:

logger.info(f"自动截短原始标题为:\n{copyd['rawtitle']}")

return

else:

# 以防万一，当整理路径非常深或者标题起始很长一段没有标点符号时，硬性截短生成的名称

templates = cfg.NamingRule.save_dir.template + os.sep + cfg.NamingRule.filename.template

copyd['title'] = copyd['title'][:remaining]

copyd['rawtitle'] = copyd['rawtitle'][:remaining]

if (copyd['title'] == '' and '$title' in templates) or (copyd['rawtitle'] == '' and '$rawtitle' in templates):

logger.error("命名规则导致标题被截断至空，请增大'max_path_len'或减小'max_actress_count'配置项后重试")

logger.debug((d, templates, cfg.NamingRule.max_path_len))

return

# 如果不整理文件，则保存抓取的数据到当前目录

if cfg.File.enable_file_move is False:

save_dir = os.path.dirname(movie.files[0])

filebasename = os.path.basename(movie.files[0])

ext = os.path.splitext(filebasename)[1]

basename = filebasename.replace(ext, '')

else:

save_dir = os.path.normpath(cfg.NamingRule.save_dir.substitute(copyd)).strip()

basename = os.path.normpath(cfg.NamingRule.filename.substitute(copyd)).strip()

movie.save_dir = save_dir

movie.basename = basename

if 'universal' in cfg.NamingRule.media_servers:

movie.nfo_file = os.path.join(save_dir, 'movie.nfo')

movie.fanart_file = os.path.join(save_dir, 'fanart.jpg')

movie.poster_file = os.path.join(save_dir, 'poster.jpg')

else:

movie.nfo_file = os.path.join(save_dir, f'{basename}{cdx}.nfo')

movie.fanart_file = os.path.join(save_dir, f'{basename}{cdx}-fanart.jpg')

movie.poster_file = os.path.join(save_dir, f'{basename}{cdx}-poster.jpg')

if d['title'] != copyd['title']:

logger.info(f"自动截短标题为:\n{copyd['title']}")

if d['rawtitle'] != copyd['rawtitle']:

logger.info(f"自动截短原始标题为:\n{copyd['rawtitle']}")

def postStep_videostation(movie: Movie):

"""使用群晖Video Station时，生成额外的影片poster、fanart文件"""

fanart_ext = os.path.splitext(movie.fanart_file)[1]

for file in movie.new_paths:

# 创建与影片同名的fanart

samename_fanart = os.path.splitext(file)[0] + fanart_ext

copyfile(movie.fanart_file, samename_fanart)

# 将现有poster以新名字复制一份

samename_poster = os.path.splitext(file)[0] + '.png'

crop_poster(movie.poster_file, samename_poster)

def postStep_MultiMoviePoster(movie: Movie):

"""为多分片的影片创建额外的poster图片"""

# Jellyfin将多分片影片视作CD1的附加部分，nfo文件名、fanart均使用的CD1的文件名，

# 只有poster是为各个分片创建的

# Jellyfin 10.8.9版本, 经测试分片可以自动使用poster.jpg，不必为每个分片创建单独的poster

return

for i, _ in enumerate(movie.files[1:], start=2):

cdx_poster = os.path.join(movie.save_dir, f'{movie.basename}-CD{i}-poster.jpg')

copyfile(movie.poster_file, cdx_poster)

def reviewMovieID(all_movies, root):

"""人工检查每一部影片的番号"""

count = len(all_movies)

logger.info('进入手动模式检查番号: ')

for i, movie in enumerate(all_movies, start=1):

id = repr(movie)[7:-2]

print(f'[{i}/{count}]\t{Fore.LIGHTMAGENTA_EX}{id}{Style.RESET_ALL}, 对应文件:')

relpaths = [os.path.relpath(i, root) for i in movie.files]

print('\n'.join([' '+i for i in relpaths]))

s = input("回车确认当前番号，或直接输入更正后的番号（如'ABC-123'或'cid:sqte00300'）")

if not s:

logger.info(f"已确认影片番号: {','.join(relpaths)}: {id}")

else:

s = s.strip()

s_lc = s.lower()

if s_lc.startswith(('cid:', 'cid=')):

new_movie = Movie(cid=s_lc[4:])

new_movie.data_src = 'cid'

new_movie.files = movie.files

elif s_lc.startswith('fc2'):

new_movie = Movie(s)

new_movie.data_src = 'fc2'

new_movie.files = movie.files

else:

new_movie = Movie(s)

new_movie.data_src = 'normal'

new_movie.files = movie.files

all_movies[i-1] = new_movie

new_id = repr(new_movie)[7:-2]

logger.info(f"已更正影片番号: {','.join(relpaths)}: {id} -> {new_id}")

print()

SUBTITLE_MARK_FILE = os.path.abspath(mei_path('image/sub_mark.png'))

def crop_poster_wrapper(fanart_file, poster_file, method='normal', hard_sub=False):

"""包装各种海报裁剪方法，提供统一的调用"""

if method == 'baidu':

from core.ai_crop.baidu_aip import aip_crop_poster

try:

aip_crop_poster(fanart_file, poster_file)

except Exception as e:

logger.debug('人脸识别失败，回退到常规裁剪方法')

logger.debug(e, exc_info=True)

crop_poster(fanart_file, poster_file)

elif method == 'retina':

from core.ai_crop.retina import ai_crop_poster

try:

ai_crop_poster(fanart_file, poster_file)

except Exception as e:

logger.debug('人脸识别失败，回退到常规裁剪方法')

logger.debug(e, exc_info=True)

crop_poster(fanart_file, poster_file)

else:

crop_poster(fanart_file, poster_file)

if cfg.Picture.add_label_to_cover:

if hard_sub == True:

add_label_to_poster(poster_file, SUBTITLE_MARK_FILE)

def RunNormalMode(all_movies):

"""普通整理模式"""

def check_step(result, msg='步骤错误'):

"""检查一个整理步骤的结果，并负责更新tqdm的进度"""

if result:

inner_bar.update()

else:

raise Exception(msg + '\n')

outer_bar = tqdm(all_movies, desc='整理影片', ascii=True, leave=False)

total_step = 7 if cfg.Translate.engine else 6

return_movies = []

for movie in outer_bar:

try:

# 初始化本次循环要整理影片任务

filenames = [os.path.split(i)[1] for i in movie.files]

logger.info('正在整理: ' + ', '.join(filenames))

inner_bar = tqdm(total=total_step, desc='步骤', ascii=True, leave=False)

# 依次执行各个步骤

inner_bar.set_description(f'启动并发任务')

all_info = parallel_crawler(movie, inner_bar)

msg = f'为其配置的{len(cfg.CrawlerSelect[movie.data_src])}个抓取器均未获取到影片信息'

check_step(all_info, msg)

inner_bar.set_description('汇总数据')

has_required_keys = info_summary(movie, all_info)

check_step(has_required_keys)

if cfg.Translate.engine:

inner_bar.set_description('翻译影片信息')

success = translate_movie_info(movie.info)

check_step(success)

generate_names(movie)

check_step(movie.save_dir, '无法按命名规则生成目标文件夹')

if not os.path.exists(movie.save_dir):

os.makedirs(movie.save_dir)

inner_bar.set_description('下载封面图片')

if cfg.Picture.use_big_cover:

cover_dl = download_cover(movie.info.covers, movie.fanart_file, movie.info.big_covers)

else:

cover_dl = download_cover(movie.info.covers, movie.fanart_file)

check_step(cover_dl, '下载封面图片失败')

cover, pic_path = cover_dl

# 确保实际下载的封面的url与即将写入到movie.info中的一致

if cover != movie.info.cover:

movie.info.cover = cover

# 根据实际下载的封面的格式更新fanart/poster等图片的文件名

if pic_path != movie.fanart_file:

movie.fanart_file = pic_path

actual_ext = os.path.splitext(pic_path)[1]

movie.poster_file = os.path.splitext(movie.poster_file)[0] + actual_ext

if cfg.Picture.use_ai_crop and (

movie.info.uncensored or

movie.data_src == 'fc2' or

movie.info.label.upper() in cfg.Picture.use_ai_crop_labels or

(R'\d' in cfg.Picture.use_ai_crop_labels and re.match(r'(\d{6}[-_]\d{3})', movie.info.dvdid))):

method = cfg.Picture.ai_engine

inner_bar.set_description('使用AI裁剪海报封面')

else:

inner_bar.set_description('裁剪海报封面')

method = 'normal'

crop_poster_wrapper(movie.fanart_file, movie.poster_file, method, movie.hard_sub)

check_step(True)

if 'video_station' in cfg.NamingRule.media_servers:

postStep_videostation(movie)

if len(movie.files) > 1 and 'universal' not in cfg.NamingRule.media_servers:

postStep_MultiMoviePoster(movie)

inner_bar.set_description('写入NFO')

write_nfo(movie.info, movie.nfo_file)

check_step(True)

if cfg.File.enable_file_move:

inner_bar.set_description('移动影片文件')

movie.rename_files()

check_step(True)

logger.info(f'整理完成，相关文件已保存到: {movie.save_dir}\n')

else:

logger.info(f'刮削完成，相关文件已保存到: {movie.nfo_file}\n')

if movie != all_movies[-1] and cfg.Crawler.sleep_after_scraping > 0:

time.sleep(cfg.Crawler.sleep_after_scraping)

return_movies.append(movie)

except Exception as e:

logger.debug(e, exc_info=True)

logger.error(f'整理失败: {e}')

finally:

inner_bar.close()

return return_movies

def download_cover(covers, fanart_path, big_covers=[]):

"""下载封面图片"""

# 优先下载高清封面

fanart_base = os.path.splitext(fanart_path)[0] + '.'

for url in big_covers:

pic_path = fanart_base + url.split('.')[-1].lower()

for _ in range(cfg.Network.retry):

try:

info = download(url, pic_path)

if valid_pic(pic_path):

filesize = get_fmt_size(pic_path)

width, height = get_pic_size(pic_path)

elapsed = time.strftime("%M:%S", time.gmtime(info['elapsed']))

speed = get_fmt_size(info['rate']) + '/s'

logger.info(f"已下载高清封面: {width}x{height}, {filesize} [{elapsed}, {speed}]")

return (url, pic_path)

except requests.exceptions.HTTPError:

# HTTPError通常说明猜测的高清封面地址实际不可用，因此不再重试

break

# 如果没有高清封面或高清封面下载失败

for url in covers:

pic_path = fanart_base + url.split('.')[-1].lower()

for _ in range(cfg.Network.retry):

try:

download(url, pic_path)

if valid_pic(pic_path):

logger.debug(f"已下载封面: '{url}'")

return (url, pic_path)

else:

logger.debug(f"图片无效或已损坏: '{url}'，尝试更换下载地址")

break

except Exception as e:

logger.debug(e, exc_info=True)

logger.error(f"下载封面图片失败")

logger.debug('big_covers:'+str(big_covers) + ', covers'+str(covers))

return None

def error_exit(success, err_info):

"""检查业务逻辑是否成功完成，如果失败则报错退出程序"""

if not success:

logger.error(err_info)

sys_exit(1)

def sys_exit(code):

# 脚本退出机制：检查是否需要关机 → 若不需要，检查是否需要保持当前窗口

if args.shutdown:

shutdown()

elif not (args.auto_exit or cfg.Other.auto_exit):

os.system('pause')

# 最后传退出码退出

sys.exit(code)

def only_fetch():

# 1. 读取缓存文件

movie_list: List[dict] = []

movies: List[Movie] = []

with open(args.data_cache_file, encoding='utf-8') as f:

movie_list = json.load(f)

# 2. 重新实例化Movie

if len(movie_list) == 0:

return 0

for mov in movie_list:

movie = Movie(mov['dvdid'])

for k, v in mov.items():

setattr(movie, k, v)

movies.append(movie)

rmovies = RunNormalMode(movies)

# 将数据回写到缓存文件

store_movies = []

for m in rmovies:

d = m.__dict__

d['info'] = {'title': m.info.title}

store_movies.append(d)

json_str = json.dumps(store_movies, ensure_ascii=False)

# 打开文件进行写入

with open(args.data_cache_file, 'w', encoding='utf-8') as file:

file.write(json_str) # 将数据写入文件

return 0

if __name__ == "__main__":

colorama.init(autoreset=True)

# python版本检查

import platform

from packaging import version

py_version_ok = version.parse(platform.python_version()) >= version.parse('3.8')

error_exit(py_version_ok, '请使用3.8及以上版本的Python')

# 检查更新

version_info = 'JavSP ' + getattr(sys, 'javsp_version', '未知版本/从代码运行')

logger.debug(version_info.center(60, '='))

check_update(cfg.Other.check_update, cfg.Other.auto_update)

root = get_scan_dir(cfg.File.scan_dir)

error_exit(root, '未选择要扫描的文件夹')

# 导入抓取器，必须在chdir之前

import_crawlers(cfg)

os.chdir(root)

if args.only_fetch == True:

#仅刮削

sys_exit(only_fetch())

print(f'扫描影片文件...')

recognized = scan_movies(root, args.only_scan, args.data_cache_file)

movie_count = len(recognized)

# 手动模式下先让用户处理无法识别番号的影片（无论是all还是failed）

if args.manual:

recognize_fail = get_failed_when_scan()

fail_count = len(recognize_fail)

if fail_count > 0:

reviewMovieID(recognize_fail, root)

movie_count += fail_count

else:

recognize_fail = []

error_exit(movie_count, '未找到影片文件')

logger.info(f'扫描影片文件：共找到 {movie_count} 部影片')

if args.only_scan == True:

#仅识别，不刮削

sys_exit(0)

if args.manual == 'all':

reviewMovieID(recognized, root)

RunNormalMode(recognized + recognize_fail)

sys_exit(0)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

JavSP.py

JavSP.py

Files

JavSP.py

Latest commit

History

JavSP.py

File metadata and controls